搜索_华为云

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

r安装包。您可以使用以下指令安装Docker。关于安装Docker的更多指导内容参见Docker官方文档。 curl -fsSL get.docker.com -o get-docker.sh sh get-docker.sh 如果docker images命令可以执行成功，表示Docker已安装，此步骤可跳过。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
ModelArts入门实践 - AI开发平台ModelArts

Standard，并进行在线推理预测的体验过程。面向AI开发零基础的用户从0-1制作自定义镜像并创建AI应用针对ModelArts不支持的AI引擎，您可以构建自定义镜像，并将镜像导入ModelArts，创建为模型。本案例详细介绍如何使用自定义镜像创建模型，并部署成在线服务。面向熟悉代码编写

 帮助中心 > AI开发平台ModelArts > 快速入门
Notebook中构建新镜像 - AI开发平台ModelArts

|——megatron/ # 注意：该文件夹从Megatron-LM中复制得到 |——... 您可以在Notebook中导入完代码之后，在Notebook运行sh scripts/install.sh命令提前下载完整代码包和安装依赖包，然

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

动文件。代码目录为代码启动文件的一级目录。 “job_config”字段下的“inputs”和“outputs”分别为算法的输入输出管道。可以按照实例指定“data_url”和“train_url”，在代码中解析超参分别指定训练所需要的数据文件本地路径和训练生成的模型输出本地路径。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

6.3.907-xxx.zip，并执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网。 unzip AscendCloud-*.zip -d ./AscendCloud && unzip ./AscendCloud/AscendCloud-OPP-*

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
修复Standard专属资源池故障节点 - AI开发平台ModelArts

节点操作。高可用冗余节点高可用冗余节点作为专属资源池内的备用节点，能够在普通节点故障时自动进行切换，可以提升资源池整体的SLA，有效避免单个节点故障造成的业务受损。用户可以根据自身业务的可靠性要求设置池内的高可用节点数量。高可用冗余节点不能用于业务运行，将影响资源池的实际可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
训练的数据集预处理说明 - AI开发平台ModelArts

--workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以 llama2-13b 为例，输出数据路径为：/home/ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

--workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以 llama2-13b 为例，输出数据路径为：/home/ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

请求要求代理的身份认证，与401类似，但请求者应当使用代理进行授权。 408 Request Time-out 服务器等候请求时发生超时。客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict 服务器在完成请求时发生冲突。返回该状态码，表明客户端尝试创建的资源已经

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

修改build_image.sh 执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保机器环境可以访问公网。 sh build_image.sh --base-image=${base_image} --image-name=${image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

ibstat查看网卡非Active状态。可能是亚健康，建议先重启节点，若重启节点后未恢复，发起维修流程。配置节点告警通知节点故障指标(nt_npg)默认会上报到AOM，您可以在AOM配置短信、邮件等通知方式。以下步骤基于AOM1.0配置。登录AOM控制台在左侧导航栏选择“告警 > 告警规则”，在右上角单击“添加告警”。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

修改build_image.sh 执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保机器环境可以访问公网。 sh build_image.sh --base-image=${base_image} --image-name=${image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

<模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 准备工作
查看批量服务的事件 - AI开发平台ModelArts

服务部署和运行过程中，关键事件支持手动/自动刷新。查看操作在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 批量服务”，在服务列表中，您可以单击名称/ID，进入服务详情页面。在服务详情页面，切换到“事件”页签，查看事件信息。父主题：管理批量推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
训练的数据集预处理说明 - AI开发平台ModelArts

--workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以 llama2-13b 为例，输出数据路径为：/home/ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

--workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。 ModelLink微调数据集预处理参数说明微调包含SFT和LoRA微调。数据集预处理脚本参数说明如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
查看在线服务的事件 - AI开发平台ModelArts

服务部署和运行过程中，关键事件支持手动/自动刷新。查看操作在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 在线服务”，在服务列表中，您可以单击名称/ID，进入服务详情页面。在服务详情页面，切换到“事件”页签，查看事件信息。父主题：管理同步在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ce/ascend_vllm/ 执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保机器环境可以访问公网。 sh build_image.sh --base-image=${base_image} --image-name=${image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

] } } } ] } 未创建以上权限策略前，所有子账号默认可以挂载SFS Turbo。当您创建了以上SFS权限管控策略后，没有被授予以上权限的子账号，默认在ModelArts Console上创建训练作业时无法挂载SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

修改build_image.sh 执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保机器环境可以访问公网。 sh build_image.sh --base-image=${base_image} --image-name=${image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作

总条数： 1465

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线