搜索_华为云

镜像方案说明 - AI开发平台ModelArts

080 CANN：cann_8.0.rc3 PyTorch：2.1.0 基础镜像的使用用户通过ECS获取和上传基础镜像步骤拉取基础镜像并上传至SWR中。随后可通过使用基础镜像、ECS中构建新镜像的方式（可二选一）来部署训练环境。方案的区别如下：直接使用基础镜像方案：用户可在训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

29a CANN：cann_8.0.rc2 PyTorch：2.1.0 基础镜像的使用用户通过ECS获取和上传基础镜像步骤拉取基础镜像并上传至SWR中。随后可通过使用基础镜像、ECS中构建新镜像、Notebook中构建新镜像的方式（三选一）来部署训练环境。方案的区别如下：直接

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

df3 CANN：cann_8.0.rc3 PyTorch：2.1.0 基础镜像的使用用户通过ECS获取和上传基础镜像步骤拉取基础镜像并上传至SWR中。随后可通过使用基础镜像、ECS中构建新镜像的方式（可二选一）来部署训练环境。方案的区别如下：直接使用基础镜像方案：用户可在训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
模型训练存储加速 - AI开发平台ModelArts

Turbo存储加速的具体方案请查看：面向AI场景使用OBS+SFS Turbo的存储加速实践。设置训练存储加速当完成上传数据至OBS并预热到SFS Turbo中步骤后，在ModelArts Standard中创建训练作业时，设置训练“SFS Turbo”，在“文件系统”中选择SFS Turbo实例名

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
自动学习中偏好设置的各参数训练速度大概是多少 - AI开发平台ModelArts

自动学习中偏好设置的各参数训练速度大概是多少偏好设置中： performance_first：性能优先，训练时间较短，模型较小。对于TXT、图片类训练速度为10毫秒。 balance：平衡。对于TXT、图片类训练速度为14毫秒。 accuracy_first：精度优先，训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ ModelArts训练平台预置了部分NCCL环境变量，如表1所示。这些环境变量建议保持默认值。表1 预置的环境变量环境变量说明 NCCL_SOCKET_IFNAME 指定通信的网卡名称。 NCCL_IB_GID_INDEX 系统设置的默认值为3，表示使用RoCE

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
镜像方案说明 - AI开发平台ModelArts

080 CANN：cann_8.0.rc3 PyTorch：2.1.0 基础镜像的使用用户通过ECS获取和上传基础镜像步骤拉取基础镜像并上传至SWR中。随后可通过使用基础镜像、ECS中构建新镜像的方式（二选一）来部署训练环境。方案的区别如下：直接使用基础镜像方案：用户可在训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

df3 CANN：cann_8.0.rc3 PyTorch：2.1.0 基础镜像的使用用户通过ECS获取和上传基础镜像步骤拉取基础镜像并上传至SWR中。随后可通过使用基础镜像、ECS中构建新镜像的方式（二选一）来部署训练环境。方案的区别如下：直接使用基础镜像方案：用户可在训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

S桶名称）。 “启动文件”：选择代码目录下上传的训练脚本“train.py”。 “输入”：单击“增加训练输入”，设置训练输入的“参数名称”为“data_url”。设置数据存储位置为您的OBS目录，例如 “/test-modelarts-xx/pytorch/mnist-data/

帮助中心 > AI开发平台ModelArts > 快速入门
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

0）上，用于分布式训练期间通信的端口。默认设置为18888端口。当遇到master_port冲突问题时，可通过设置MA_TORCHRUN_MASTER_PORT环境变量值修改端口配置。 rdzv_id：Rendezvous标识，设置为带有训练作业ID的值。 rdzv_backe

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
Notebook Cache盘告警上报 - AI开发平台ModelArts

service_id:xxx，然后单击“确定”。监控对象设置完成后，选择“统计方式”和“统计周期”。 “告警条件设置”：触发条件根据实际需求设置。图1 监控对象指标设置图2 设置指标统计方式图3 告警条件设置设置告警通知，单击“立即创建”。 “告警方式”：选择“直接告警”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
修改训练作业优先级 - AI开发平台ModelArts

仅使用新版专属资源池训练时才支持设置训练作业优先级。公共资源池和旧版专属资源池均不支持设置训练作业优先级。作业优先级取值为1~3，默认优先级为1，最高优先级为3。默认用户权限可选择优先级1和2，配置了“设置作业为高优先级权限”的用户可选择优先级1~3。如何设置训练作业优先级在创建训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
训练过程中无法找到so文件 - AI开发平台ModelArts

/usr -name *libcudart.so*); 设置环境变量LD_LIBRARY_PATH，设置完成后，重新下发作业即可。例如so文件的存放路径为：/use/local/cuda/lib64，LD_LIBRARY_PATH设置如下： export LD_LIBRARY_PAT

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在MaaS体验模型服务 - AI开发平台ModelArts

在模型列表，选择要体验的模型服务，单击操作列“更多 > 体验”，进入体验页面。在参数设置页面，拖动或直接输入数值配置推理参数。单击“恢复默认”可以将参数值调回默认值。图2 设置推理参数表1 参数设置参数说明温度/Temperature 设置推理温度。数值较高，输出结果更加随机。数值较低，输出结果更加集中和确定。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

”页面。在选择模型及配置中，单击“增加模型版本进行灰度发布”添加新版本。图1 灰度发布您可以设置两个版本的流量占比，服务调用请求根据该比例分配。其他设置可参考参数说明。完成设置后，单击下一步。确认信息无误后，单击“提交”部署在线服务。父主题：在线服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

创建镜像组织 Step3 在宿主机上传镜像到SWR 在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中复制临时登录指令，即可完成登录。图2 复制登录指令登录指令输入之后，使用下列示例命令： docker tag sdxl-train:0

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.907）
物体检测标注时除了位置、物体名字，是否可以设置其他标签，比如是否遮挡、亮度等？ - AI开发平台ModelArts

物体检测标注时除了位置、物体名字，是否可以设置其他标签，比如是否遮挡、亮度等？可以通过修改数据集给标签添加自定义属性来设置一些自定义的属性。图1 修改数据集父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
更新服务配置 - AI开发平台ModelArts

不允许参数status设置成running（启动）或设置参数configs（服务配置）。当前服务状态是waiting（排队中）时，不允许参数status设置成running（启动）。当前服务状态是concerning（告警）时，不允许参数status设置成running（启动）。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

）服务。添加训练作业使用权限。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略。 “策略名称”：设置自定义策略名称，例如：trainJob。 “策略配置方式”：选择JSON视图。 “策略内容”：填入如下内容。 { "Version":

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
更新MaaS模型服务的模型权重 - AI开发平台ModelArts

个模型框架。权重设置与词表选择“自定义权重”。选择自定义权重路径选择存放待更新的模型权重文件的OBS路径，必须选择到模型文件夹。权重校验开启权重文件校验。参考部署模型服务，用新建的模型部署模型服务。 “模型设置”选择上一步新建的模型。 “资源设置”和待升级的模型服务保持一致。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务

总条数： 887

上一页
1
...
14
15
16
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

自动学习中偏好设置的各参数训练速度大概是多少 - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

物体检测标注时除了位置、物体名字，是否可以设置其他标签，比如是否遮挡、亮度等？ - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

更新MaaS模型服务的模型权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线