搜索_华为云

推理场景介绍 - AI开发平台ModelArts

如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU）本章节介绍如何从0到1制作镜像，并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是MPI，训练使用的资源是CPU或GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux x86_

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU）本章节介绍如何从0到1制作镜像，并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是MPI，训练使用的资源是CPU或GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
安装Gallery CLI配置工具 - AI开发平台ModelArts

器则默认是北京四区域，此处填写“cn-north-4”。 iam_timeout （可选）IAM访问超时时间，单位为秒，缺省值是5。当环境网络不稳定时，建议将该值改大。如果超过该时间IAM还没有响应，系统会返回超时错误码，便于定位链接故障。 iam_domain 用户的账号ID，获取方式请参见获取账号名和账号ID。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
更新Notebook实例 - AI开发平台ModelArts

FAILED：任务失败 COMPLETED：任务完成 step Integer 任务的步骤。枚举值如下: 1：准备存储 2：准备计算资源 3：配置网络 4：初始化实例 step_description String 任务某个步骤的描述。表9 EndpointsRes 参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询训练作业版本详情 - AI开发平台ModelArts

volumes属性列表参数是否必选参数类型说明 nfs 否 Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体说明请参见表6。 host_path 否 Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体说明请参见表7。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
推理场景介绍 - AI开发平台ModelArts

如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
使用MaaS调优模型 - AI开发平台ModelArts

全参微调：直接在模型上训练，影响模型全量参数的微调训练，效果较好，收敛速度较慢，训练时间较长。 LoRA微调：冻结原模型，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数，效果接近或略差于全参训练，收敛速度快，训练时间短。增量预训练：在现有预训练模型基础上，利用新数据或特定领域的数据增强

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

的机器上使用docker命令将镜像上传到容器镜像服务的镜像仓库。如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。如果机器与容器镜像仓库不在同一区域，则上传镜像走公网链路，机器需要绑定弹性公网IP。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
查询训练作业版本列表 - AI开发平台ModelArts

训练作业模型总准确率。表13 volumes属性列表参数参数类型说明 nfs object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体请参见表14。 host_path object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体请参见表15。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

exemlProjectVersion 自动学习项目的版本 workflow Workflow项目 pool 专属资源池 network 专属资源池网络连接 trainJob 训练作业 trainJobLog 训练作业的运行日志 trainJobInnerModel 系统预置模型 model

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

功能一起使用。 SMN FullAccess 可选 VPC虚拟私有云子用户在创建ModelArts的专属资源池过程中，如果需要开启自定义网络配置，需要配置VPC权限。 VPC FullAccess 可选 SFS弹性文件服务授予子用户使用SFS服务的权限，ModelArts的专

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
创建训练作业 - AI开发平台ModelArts

volumes属性列表参数是否必选参数类型说明 nfs 否 Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体说明请参见表6。 host_path 否 Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体说明请参见表7。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
启动推理服务 - AI开发平台ModelArts

查看卡IP，在其中一个宿主机上执行。 for i in $(seq 0 7);do hccn_tool -i $i -ip -g;done 检查卡之间的网络是否通。 # 在另一个机器上执行，29.81.3.172是上一步输出的ipaddr的值 hccn_tool -i 0 -ping -g address

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
ModelArts最佳实践案例列表 - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导 Wav2Lip，人脸说话视频模型，训练、推理 Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进

 帮助中心 > AI开发平台ModelArts > 最佳实践
PD分离部署使用说明 - AI开发平台ModelArts

8089；端口设置顺序必须与global rank table文件中各全量和增量节点顺序一致，否则会报错。确保scheduler实例和P、D实例之间网络通畅，检查代理设置例如no_proxy环境变量，避免scheduler访问P、D实例时走不必要的网关。前提条件已完成推理环境镜像制作，具体参见准备推理环境。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
推理场景介绍 - AI开发平台ModelArts

如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
开发环境的应用示例 - AI开发平台ModelArts

"description": "AI inference application development, preconfigured ModelBox and AI engine LibTorch, only SSH connection supported.", "dev_services":

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Megatron-LM是一个用于大规模语言建模的模型。它基于GPT（Generative Pre-trained Transformer）架构，这是一种基于自注意力机制的神经网络模型，广泛用于自然语言处理任务，如文本生成、机器翻译和对话系统等。 DeepSpeed是开源的加速深度学习训练的库。它针对大规模的模型和分

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

04的镜像；系统盘设置为100GiB。具体操作请参考购买并登录弹性云服务器。图2 选择镜像和磁盘购买弹性公网IP并绑定到弹性云服务器。具体操作请参考配置网络。配置VM环境。在docker机器中，使用如下命令下载安装脚本。 wget https://cnnorth4-modelarts-sdk

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook

总条数： 409

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线