搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练步骤1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
保存ckpt时超时报错 - AI开发平台ModelArts

需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

由于权限配置需要等待15-30分钟生效，建议在配置完成后，等待30分钟，再执行如下验证操作。使用用户组02中任意一个子账号登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。首次登录会提示修改密码，请根据界面提示进行修改。验证ModelArts权限。在左上角的服务列表中，选

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
（可选）Session鉴权 - AI开发平台ModelArts

储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以password保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_PASSWORD。 __PASSWORD = os.envi

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

如果遇到“rmmod: ERROR: Module nvidia is in use”，执行以下命令： sudo lsof /dev/nvidia* 并再次验证： lsmod | grep nvidia 再次执行“nvidia-smi”，显示成功，且是最新安装的NVIDIA驱动。父主题： Lite

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查询团队标注任务统计信息 - AI开发平台ModelArts

data_spliting_enable Boolean 根据样本标注统计，判断数据集是否可以进行训练/验证集切分。可选值如下： true：数据集可以进行训练/验证集切分 false：数据集无法进行训练/验证集切分 grouped_label_stats Map<String,Array<LabelStats>>

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

将子用户子账号加入用户组。在“加入用户组”步骤中，选择“用户组”，然后单击“创建用户”。系统将前面设置的多个用户加入用户组中。用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
推理性能测试 - AI开发平台ModelArts

动态benchmark测试结果（示意图）投机推理benchmark验证本章节介绍如何进行投机推理benchmark验证，当前投机推理benchmark仅支持在Notebook中进行测试。进入benchmark_tools目录下。 cd benchmark_tools 运行验证脚本speculative_benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

动态benchmark测试结果（示意图）投机推理benchmark验证本章节介绍如何进行投机推理benchmark验证，当前投机推理benchmark仅支持在Notebook中进行测试。进入benchmark_tools目录下。 cd benchmark_tools 运行验证脚本speculative_benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
配置kubectl工具 - AI开发平台ModelArts

完成公网地址绑定后，在“集群信息”找到“连接信息”，单击kubectl后的“配置”按钮。按照界面提示步骤操作即可。图6 配置kubectl 验证。在安装了kubectl工具的机器上执行如下命令，显示集群节点即为成功。 kubectl get node 父主题： Lite Cluster资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
数据集版本发布失败 - AI开发平台ModelArts

议检查您的标注信息，保证标注多标签的图片，超过2张。数据集切分后，训练集和验证集包含的标签类别不一样。出现这种情况的原因：多标签场景下时，做随机数据切分后，包含某一类标签的样本均被划分到训练集，导致验证集无该标签样本。由于这种情况出现的概率比较小，可尝试重新发布版本来解决。 ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
查询数据集导出任务列表 - AI开发平台ModelArts

ratio_sample_usage Boolean 指定切分比例后，是否按指定比例随机分配训练-验证集。可选值如下： true：主动随机分配训练集-验证集 false：不主动随机分配训练集-验证集（默认值） sample_state String 样本状态。可选样本状态如下： __ALL__：已标注

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

图7 注册镜像 Step9 通过openssl创建SSL pem证书在ECS中执行如下命令，会在当前目录生成cert.pem和key.pem，并将生成的pem证书上传至OBS。证书用于后续在推理生产环境中部署HTTPS推理服务。 openssl genrsa -out key.pem

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理 10B/100B，单机多卡推理。 - 能否提供实际模型、网络验证的代码和数据等信息提供实际模型、网络验证的代码和数据。提供与业务类型类似的开源模型，例如GPT3 10B/13B。提供测试模型以及对应的Demo代码路径（开源或共享）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

item())) if args.dry_run: break # 模型验证，设置模型为验证模式，加载验证数据，计算损失函数和准确率 def test(model, device, test_loader): model.eval()

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
infiniband驱动的安装 - AI开发平台ModelArts

rm -rf MLNX_OFED_LINUX-4.3-1.0.1.0-ubuntu16.04-x86_64 USER ma-user 验证infiniband驱动是否安装成功。在训练代码中执行以下命令，如果无报错则infiniband驱动安装成功： os.system("ofed_info")

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

将子用户子账号加入用户组。在“加入用户组”步骤中，选择“用户组”，然后单击“创建用户”。系统将前面设置的多个用户加入用户组中。用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
使用边缘节点部署边缘服务能否使用http接口协议？ - AI开发平台ModelArts

使用边缘节点部署边缘服务能否使用http接口协议？系统默认使用https。如果您想使用http，可以采取以下两种方式：方式一：在部署边缘服务时添加如下环境变量： MODELARTS_SSL_ENABLED = false 图1 添加环境变量方式二：在使用自定义镜像导入模型时

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 边缘服务
从OBS目录导入数据规范说明 - AI开发平台ModelArts

记录数据集信息的文件及路径信息(相对路径) ├── train.txt # 训练集中各图片路径信息(相对路径) ├── valid.txt # 验证集中各图片路径信息(相对路径) │ ├── obj_train_data/ # 训练集的图片与对应的标注文件所在目录 │

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
推理性能测试 - AI开发平台ModelArts

变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-3rdLLM-x.x.x.zip的llm_evaluation目录下。代码目录如下: benchmark_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

总条数： 368

上一页
1
...
4
5
6
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

配置kubectl工具 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

使用边缘节点部署边缘服务能否使用http接口协议？ - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线