搜索_华为云

使用SmoothQuant量化 - AI开发平台ModelArts

le的过程。 --model-output：量化模型权重保存路径。 --smooth-strength：平滑系数，推荐先指定为0.5，后续可以根据推理效果进行调整。 --per-token：激活值量化方法，如果指定则为per-token粒度量化，否则为per-tensor粒度量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

168.20.0/24重叠，否则会和专属资源池的网段发生冲突，因为专属资源池的默认网段为192.168.20.0/24。专属资源池实际使用的网段可以在资源池的详情页面查看“网络”获取。条件二：SFS Turbo网段不能与172网段重叠，否则会和容器网络发生冲突，因为容器网络使用的是172网段。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
创建ModelArts数据校验任务 - AI开发平台ModelArts

填写基本信息。基本信息包括“名称”、“版本”和“描述”。其中“版本”信息由系统自动生成，按“V0001”、“V0002”规则命名，用户无法修改。您可以根据实际情况填写“名称”和“描述”信息。图1 创建数据处理基本信息设置场景类别。场景类别当前支持“图像分类”和“物体检测”。设置数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

在主机上新建config.yaml文件。 config.yaml文件用于配置pod，本示例中使用sleep命令启动pod，便于进入pod调试。您也可以修改command为对应的任务启动命令（如“python train.py”），任务会在启动容器后执行。 config.yaml内容如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

&& \ 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 若无法访问公网，则可以配置代理，增加`--build-arg`参数指定代理地址，可访问公网。 docker build

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export USE_PFA_HIGH_PRECISION_MODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export USE_PFA_HIGH_PRECISION_MODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
配置Workflow参数 - AI开发平台ModelArts

dict required 参数是否必填标记。默认required=True。 Delay参数不能设required=False。运行时前端可以不填此参数。否 bool 使用案例 int类型参数 from modelarts import workflow as wf wf.Pl

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
查询训练作业列表 - AI开发平台ModelArts

调用成功时无此字段。 job_total_count Integer 查询到的用户创建作业总数。 job_count_limit Integer 用户还可以创建训练作业的数量。 jobs jobs结构数组训练作业的属性列表，具体请参见表4。 quotas Integer 训练作业的运行数量上限。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建处理任务 - AI开发平台ModelArts

“数据增强”表示通过简单的数据扩增例如缩放、裁剪、变换、合成等操作直接或间接的方式增加数据量。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业列表 - AI开发平台ModelArts

查询作业排列顺序的指标。默认使用create_time排序。 order 否 String 查询作业排列顺序，默认为“desc”，降序排序。也可以选择对应的“asc”，升序排序。缺省值：desc 枚举值： asc：升序 desc：降序 group_by 否 String 查询作业要搜索的分组条件。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
查询可视化作业列表 - AI开发平台ModelArts

调用成功时无此字段。 job_total_count Integer 查询的可视化作业总数。 job_count_limit Integer 用户还可以创建可视化作业的数量。 jobs jobs结构数组可视化作业的属性列表，具体请参见表4。 quotas Integer 可视化作业的运行数量上限。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

景（4台8卡Vnt1），存储方案推荐使用“SFS（存放数据）+普通OBS桶（存放代码）”，采用分布式训练。当使用SFS+OBS的存储方案可以实现存储加速，该方案的端到端实践案例请参见面向AI场景使用OBS+SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

最终的权重保存路径。修改代码如图2。图2 修改权重保存路径多机训练场景下，需要将CODE_DIR修改为OBS_CODE_DIR目录，则可以使用scripts/tools/sync_with_obs.py工具将其它节点的权重文件同步上传到主节点。修改代码如图3。图3 多机同步权重文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
准备Notebook - AI开发平台ModelArts

|——megatron/ # 注意：该文件夹从Megatron-LM中复制得到 |——... 您可以在Notebook中导入完代码之后，在Notebook运行sh scripts/install.sh命令提前下载完整代码包和安装依赖包，然

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

最终的权重保存路径。修改代码如图2。图2 修改权重保存路径多机训练场景下，需要将CODE_DIR修改为OBS_CODE_DIR目录，则可以使用scripts/tools/sync_with_obs.py工具将其它节点的权重文件同步上传到主节点。修改代码如图3。图3 多机同步权重文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

logs {pod-name} 其中{pod-name}替换为实际pod名称，可以在5的回显信息中获取。图4 成功执行动态路由的回显只有任务节点大于等于3的训练任务才能成功执行动态路由。如果执行失败可以参考故障排除：ranktable路由优化执行失败处理。故障排除：ranktable路由优化执行失败

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
推理精度测试 - AI开发平台ModelArts

启动脚本，建立线程池发送请求，并汇总结果 ├── service_predict.py # 发送请求的服务执行精度测试启动脚本eval_test.py，具体操作命令如下，可以根据参数说明修改参数。 python eval_test.py \ --max_workers=1 \ --service_name=qwen-14b-test

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

10:30:00将专属资源池转为包年/包月计费，购买时长为1个月，1个月到期后用户将退订资源池。那么在3~4月份，该专属资源池总共产生多少费用呢？计费构成分析可以将专属资源池的使用阶段按照计费模式分为两段：在2023/03/18 15:30:00 ~ 2023/03/20 10:30:00期间为按需计费，2023/03/20

帮助中心 > AI开发平台ModelArts > 计费说明
Notebook中构建新镜像 - AI开发平台ModelArts

|——megatron/ # 注意：该文件夹从Megatron-LM中复制得到 |——... 您可以在Notebook中导入完代码之后，在Notebook运行sh scripts/install.sh命令提前下载完整代码包和安装依赖包，然

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像

总条数： 1560

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

配置Workflow参数 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

查询可视化作业列表 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线