搜索_华为云

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

通过ModelArts的Notebook，在JupyterLab中使用OBS上传下载数据。建议配置。开发环境监控功能 AOM aom:alarm:put 调用AOM的接口，获取Notebook相关的监控数据和事件，展示在ModelArts的Notebook中。建议配置。 VPC接入 VPC vpc:ports:create

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
使用MaaS部署模型服务 - AI开发平台ModelArts

更多选项内容审核选择是否打开内容审核，默认启用。开关打开（默认打开），内容审核可以阻止模型推理中的输入输出中出现不合规的内容，但可能会对接口性能产生较大影响。开关关闭，停用内容审核服务，将不会审核模型推理中的输入输出，模型服务可能会有违规风险，请谨慎关闭。关闭“内容审核”开

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询训练作业列表 - AI开发平台ModelArts

obs_url String 训练作业日志保存的OBS地址。 host_path String 训练作业日志保存的宿主机的路径。表56 调用训练接口失败响应参数参数类型描述 error_msg String 调用失败时的错误信息，调用成功时无此字段。 error_code String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 ModelArts会定期收集资源池中各节点的关键资源（GPU、NPU、CPU、Memory等）的使用情况以及开发环境、训练作业、推理服务的关键资源的使用情况，并上报到AOM，用户可直接在AOM上查看。登录AOM控制台查看监控指标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

图中蓝色loss_0是NPU迭代曲线，黄色loss_1是GPU的迭代曲线。问题定位解决使用ptdbg_ascend工具dump全网数据，dump接口设置方法具体参考PyTorch精度工具。dump完成后compare GPU和NPU结果进行分析。 dropout算子引入了随机性偏差，如下图：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

/home/ma-user/stable-diffusion-webui && python3 launch.py --skip-torch-cuda-test --port 30028 --enable-insecure-extension-access --listen --log-startup

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

${container_name} bash python3 launch.py --port 8183 --skip-torch-cuda-test --enable-insecure-extension-access --listen --log-startup --disable-safe-unpickle

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎背景说明 ModelArts支持第三方的推理框架在ModelArts上部署，本文以TFServing框架、Triton框架为例，介绍如何迁移到推理自定义引擎。 TensorFlow Serving是一个灵活、

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
训练作业卡死检测 - AI开发平台ModelArts

复制单个大文件5G以上时可采用： from moxing.framework.file import file_io 查看当前moxing调用的接口版本：file_io._LARGE_FILE_METHOD，如果输出值为1则为V1版本，如果输出值为2，则为V2版本。 V1版本修改：file_io

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
准备镜像环境 - AI开发平台ModelArts

准备镜像环境准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备镜像环境 - AI开发平台ModelArts

准备镜像环境准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像环境 - AI开发平台ModelArts

准备镜像环境准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 准备工作
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

/home/ma-user/stable-diffusion-webui 启动服务命令如下。 python launch.py --skip-torch-cuda-test --port 8183 --enable-insecure-extension-access --listen --log-startup

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

for more information. DATA="path/to/trainging_data" EVAL_DATA="path/to/test_data" LLM_TYPE="minicpm" # if use openbmb/MiniCPM-V-2, please set LLM_TYPE=minicpm

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
自定义镜像规范 - AI开发平台ModelArts

train_dataset=dataset["train"], eval_dataset=dataset["test"], tokenizer=image_processor, compute_metrics=_mult

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
终止训练作业 - AI开发平台ModelArts

obs_url String 训练作业日志保存的OBS地址。 host_path String 训练作业日志保存的宿主机的路径。表54 调用训练接口失败响应参数参数类型描述 error_msg String 调用失败时的错误信息，调用成功时无此字段。 error_code String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
上传数据和算法至OBS（首次使用时需要） - AI开发平台ModelArts

len(val_loader), [batch_time, losses, top1, top5], prefix='Test: ') # switch to evaluate mode model.eval() with torch.no_grad():

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
查询训练作业详情 - AI开发平台ModelArts

obs_url String 训练作业日志保存的OBS地址。 host_path String 训练作业日志保存的宿主机的路径。表54 调用训练接口失败响应参数参数类型描述 error_msg String 调用失败时的错误信息，调用成功时无此字段。 error_code String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
Lite Cluster资源开通 - AI开发平台ModelArts

组成，不能以中划线结尾。购买方案 LIte Cluster场景下选择“ModelArts Lite Elastic Cluster（原生接口）”。 ModelArts Standard（标准版）用于ModelArts Standard场景下的专属资源池，具体参见创建Standard专属资源池。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

done echo "[run_mpi] resolved ip: ${ip}" # test the sshd is up while : do if [ cat < /dev/null

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码

总条数： 1040

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

上传数据和算法至OBS（首次使用时需要） - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线