搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

zip和算子包AscendCloud-OPP-6.3.907-xxx.zip，并执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网。 unzip AscendCloud-*.zip -d ./AscendCloud &&

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
在ModelArts训练时如何安装C++的依赖库？ - AI开发平台ModelArts

在ModelArts训练时如何安装C++的依赖库？在训练作业的过程中，会使用到第三方库。以C++为例，请参考如下操作步骤进行安装：将源码下载至本地并上传到OBS。使用OBS客户端上传文件的操作请参见上传文件。将上传到OBS的源码使用Moxing复制到开发环境Notebook中。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
精度调优前准备工作 - AI开发平台ModelArts

精度调优前准备工作在定位精度问题之前，首先需要排除训练脚本及参数配置等差异的干扰。目前大部分精度无法对齐的问题都是由于模型超参数、Python三方库版本、模型源码等与标杆环境（GPU/CPU）设置的不一致导致，为了在定位过程中少走弯路，需要在定位前先对训练环境及代码做有效排查。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

场景描述本文主要指导如何在GPU A系列裸金属服务器上测试RoCE性能带宽。前提条件 GPU A系列裸金属服务器已经安装了IB驱动。（网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20.04操作系统默认已经安装IB驱动。）操作步骤

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
msprobe精度比对 - AI开发平台ModelArts

下降问题，对比NPU芯片中的API计算数值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，对比相同模型在迭代前后版本的API计算数值，进行问题定位。首先通过在PyTorch训练脚本中插入dump

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
与其他云服务的关系 - AI开发平台ModelArts

ModelArts使用云监控服务（Cloud Eye Service，简称CES）监控在线服务和对应模型负载，执行自动实时监控、告警和通知操作。CES的更多信息请参见《云监控服务用户指南》。与云审计的关系 ModelArts使用云审计服务（Cloud Trace Service，

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts使用云监控服务（Cloud Eye Service，简称CES）监控在线服务和对应模型负载，执行自动实时监控、告警和通知操作。CES的更多信息请参见《云监控服务用户指南》。与云审计的关系 ModelArts使用云审计服务（Cloud Trace Service，

帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

exemlProjectVersion 自动学习项目的版本 workflow Workflow项目 pool 专属资源池 network 专属资源池网络连接 trainJob 训练作业 trainJobLog 训练作业的运行日志 trainJobInnerModel 系统预置模型 model 模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/home/mind/model/run_vllm.sh'。图4 修改build_image.sh 执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保机器环境可以访问公网。 sh build_image.sh --base-image=${base_image}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/home/mind/model/run_vllm.sh'。图4 修改build_image.sh 执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone，请确保机器环境可以访问公网。 sh build_image.sh --base-image=${base_image}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
管理模型训练作业 - AI开发平台ModelArts

管理模型训练作业查看训练作业详情查看训练作业资源占用情况查看模型评估结果查看训练作业事件查看训练作业日志修改训练作业优先级使用Cloud Shell调试生产训练作业重建、停止或删除训练作业管理训练容器环境变量查看训练作业标签父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

不允许的方法请确认 HTTP 方法是否正确 408 ModelArts.4205 Connection timed out. 连接后端服务超时连接在线服务超时，重试或者等待一段时间 408 ModelArts.6100 The request timed out. Please

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
不同机型的对应的软件配套版本 - AI开发平台ModelArts

v1.28.* GPU 支持在容器中使用GPU显卡的设备管理插件。 2.0.48 v1.(23|25).* huawei-npu 2.1.22（推荐） v1.(23|25|28).* NPU 支持容器里使用huawei NPU设备的管理插件。 volcano 1.15.8（推荐） v1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
查看模型评估结果 - AI开发平台ModelArts

save_path=FLAGS.train_url) 复制数据集到本地复制数据集到本地主要是为了防止长时间访问OBS容易导致OBS连接中断使得作业卡住，所以一般先将数据复制到本地再进行操作。数据集复制有两种方式，推荐使用OBS路径复制。 OBS路径（推荐）直接使用mo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜像，需要指定镜像ID，ID格式为通用唯一识别码（Universally

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
获取智能任务的信息 - AI开发平台ModelArts

objects 事件。 hard_example_path String 难例的存放路径。 hard_select_tasks Array of HardSelectTask objects 难例筛选作业列表。 manifest_path String manifest文件的存放路径。 model_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

简介场景介绍本文旨在指导客户将已有的推理业务迁移到昇腾设备上运行（单机单卡、单机多卡），并获得更好的推理性能收益。 ModelArts针对上述使用场景，在给出系统化推理业务昇腾迁移方案的基础上，提供了即开即用的云上集成开发环境，包含迁移所需要的算力资源和工具链，以及具体的No

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
分离部署推理服务 - AI开发平台ModelArts

阳一”Region上的Server和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保容器可以访问公网。步骤一检查环境 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
Eagle投机小模型训练 - AI开发平台ModelArts

config文件步骤五：训练生成权重转换成可以支持vLLM推理的格式将训练完成后的权重文件（.bin文件或. safetensors文件），移动到下载好的开源权重目录下（即步骤四：执行训练中config文件所在目录）。然后在llm_tools/spec_decode/EAGLE文件夹，执行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

规格：选择1 GPU规格。存储配置：选择“云硬盘EVS”作为存储位置。如果需要通过VS Code连接Notebook方式进行代码调试，则需开启“SSH远程开发”并选择密钥对，请参考VS Code连接Notebook方式介绍。参数填写完成后，单击“立即创建”进行规格确认。参数确认无误后

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

总条数： 415

上一页
1
...
13
14
15
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

在ModelArts训练时如何安装C++的依赖库？ - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

管理模型训练作业 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线