搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

aarch64 docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

权限”，单击右上角的“创建自定义策略”按如下要求设置完成后单击“确定”。 “策略名称”：设置自定义策略名称，例如：允许通过Cloud Shell访问运行中的训练作业。 “策略配置方式”：选择可视化视图。 “策略内容”：允许，云服务中搜索ModelArts服务并选中，操作列中搜索关键词m

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

#检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。在线服务创建成功后，您可以在服务详情页查看服务详情。您可以通过“预测”页签访问在线服务。父主题：制作自定义镜像用于推理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

28。版本使用的容器引擎为Containerd。镜像适配的Cann版本是cann_8.0.rc3，驱动版本是23.0.6。确保集群可以访问公网。文档更新内容 6.3.912版本相对于6.3.911版本新增如下内容：代码结构发生变化，统一modellink和llama-factory的启动方式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

aarch64 docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
查询开发环境实例列表 - AI开发平台ModelArts

auto_stop字段数据结构说明所示。 annotations Map<String,String> 注解信息。其中，生成的url信息，不可直接访问使用。 failed_reasons Object 创建、启动失败失败原因，如表16所示。 extend_params Map<String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

tebook中构建一个新镜像并用于模型部署。登录ModelArts控制台，在左侧导航栏中选择“全局配置”，检查是否配置了访问授权。如果未配置，请先配置访问授权。参考使用委托授权完成操作。登录ModelArts控制台，在左侧导航栏中选择“开发环境 > Notebook”，进入“Notebook”管理页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

lowSpeedTime 1800 如果安装完成后lsmod看不到nv-peer-memory，可能是由于ib驱动版本过低导致，此时需要升级ib驱动，升级命令： wget https://content.mellanox.com/ofed/MLNX_OFED-5.4-3.6.8.1/MLNX_OFED_LINUX-5

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
查询支持的镜像列表 - AI开发平台ModelArts

dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/llm_inference/ascend_vllm/ 执行以下命令制作推理镜像。安装过程需要连接互联网git clone，请确保机器可以访问公网。 nerdctl --namespace k8s.io build -t <镜像名称>:<版本名称> --build-arg BAS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

aarch64 docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

28。版本使用的容器引擎为Containerd。镜像适配的Cann版本是cann_8.0.rc3，驱动版本是23.0.6。确保集群可以访问公网。文档更新内容 6.3.911版本相对于6.3.910版本新增如下内容：文档中新增在数据预处理时，支持LLama-Factory格式的模板：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

镜像适配的Cann版本是cann_8.0.rc3。 Lite Server驱动版本要求23.0.6 PyTorch版本：2.3.1 确保容器可以访问公网。文档更新内容 6.3.912版本相对于6.3.911版本新增如下内容：代码结构发生变化，统一了modellink和llama-factory的启动方式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

如果要使用自动重启功能，资源规格必须选择八卡规格。适配的CANN版本是cann_8.0.rc3，驱动版本是23.0.6。本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容 6.3.912版本相对于6.3.911版本新增如下内容：代码结构发生变化，统一了modellink和llama-factory的启动方式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

此处生成的登录指令有效期为24小时，如果需要长期有效的登录指令，请参见获取长期有效登录指令。获取了长期有效的登录指令后，在有效期内的临时登录指令仍然可以使用。登录指令末尾的域名为镜像仓库地址，请记录该地址，后面会使用到。在安装容器引擎的机器中执行上一步复制的登录指令。登录成功会显示“Login Succeeded”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

ModelArts Lite资源池对应的CCE集群需要安装1.10.12及以上版本的华为云版Volcano插件。Volcano调度器的安装升级请参见Volcano调度器。仅华为云版Volcano插件支持开启路由加速特性。训练使用的Python版本是3.7或3.9，否则无法实现ranktable路由加速。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

镜像适配的Cann版本是cann_8.0.RC3。 DevServer驱动版本要求23.0.6 PyTorch版本：2.3.1 Python版本：3.10 确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表及权重文件地址支持模型支持模型参数量权重文件获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/llm_inference/ascend_vllm/ 执行以下命令制作推理镜像。安装过程需要连接互联网git clone，请确保机器可以访问公网。 nerdctl --namespace k8s.io build -t <镜像名称>:<版本名称> --build-arg BAS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

镜像适配的Cann版本是cann_8.0.RC3。 DevServer驱动版本要求23.0.6 PyTorch版本：2.2.0 Python版本：3.10 确保容器可以访问公网。仅支持313T、376T、400T 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表及权重文件地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）

总条数： 652

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线