搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

8f50777 transformers版本升级到4.45.0 peft版本升级到0.12.0 支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

8f50777 transformers版本升级到4.45.0 peft版本升级到0.12.0 支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

llama3系列 llama2系列 glm4-9b mixtral-8x7b baichuan2-13b 支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

llama3系列 llama2系列 glm4-9b mixtral-8x7b baichuan2-13b 支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
msprobe API预检 - AI开发平台ModelArts

pytorch run_ut -api_info ./dump.json 这里-api_info指定的是步骤2导出的dump.json文件，表示整网计算过程中API的输入输出情况。执行完成run_ut命令之后将输出api_precision_compare_result_{timestamp}

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

中，请创建命名为“test-modelarts”的桶，并创建如表1所示的文件夹。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。请确保您使用的OBS与ModelArts在同一区域。表1 OBS桶文件夹列表文件夹名称用途 obs://test-modelarts/ascend/demo-code/

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
执行微调训练任务 - AI开发平台ModelArts

yaml文件内容。 dpo，复制dpo_yaml样例模板内容覆盖demo.yaml文件内容。修改yaml文件(demo.yaml)的参数如表1所示。表1 修改重要参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
获取Workflow工作流列表 - AI开发平台ModelArts

String 排序依据字段，例如sort_by=create_time，则表示以条目的创建时间进行排序。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。具体过滤的字段，由各个接口额外定义参数。例如Workfl

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理场景介绍 - AI开发平台ModelArts

说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的模型列表和权重文件本方案支持vLLM的v0.4.2版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
查询数据集版本详情 - AI开发平台ModelArts

select：单选下拉列表 values Array of LabelAttributeValue objects 标签属性值列表。表5 LabelAttributeValue 参数参数类型描述 id String 标签属性值ID。 value String 标签属性值。表6 LabelProperty

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看批量服务的事件 - AI开发平台ModelArts

页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件信息（“XXX”表示占位符，以实际返回信息为准）解决方案正常开始部署服务。 Start to deploy service. - 异常

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
查看在线服务的事件 - AI开发平台ModelArts

页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件信息（“XXX”表示占位符，以实际返回信息为准）解决方案正常开始部署服务。 Start to deploy service. - 异常

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
获取Execution列表 - AI开发平台ModelArts

是否使用的是缓存。表10 WorkflowConditionExecution 参数参数类型描述 result String 执行结果。 metric_list Array of WorkflowMetricPair objects 工作流度量信息列表。表11 WorkflowMetricPair

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理场景介绍 - AI开发平台ModelArts

说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

精度对比误差统计工具。自动化精度对比工具。网络结构可视化工具。性能调优。性能测试。性能调优三板斧。性能分析与诊断。迁移测试报告。推理迁移验收表。 ModelArts开发环境 ModelArts作为华为云上的AI开发平台，提供交互式云上开发环境，包含标准化昇腾算力资源和完整的迁移工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
修改训练作业优先级 - AI开发平台ModelArts

如何设置训练作业优先级在创建训练作业页面可以设置训练的“作业优先级”。取值为1~3，默认优先级为1，最高优先级为3。如何修改训练作业优先级在训练作业列表页面，选择“状态”为“等待中”的训练作业，单击“作业优先级”列的，在弹窗中修改优先级后单击“确定”。图1 修改作业优先级给子账号配置"设置作业为高优先级"权限

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

如果验证自定义镜像功能成功，结果如下图所示。图3 校验接口上传自定义镜像至SWR服务。完成自定义镜像上传后，您可以在“容器镜像服务>我的镜像>自有镜像”列表中看到已上传镜像。将自定义镜像创建为模型参考从容器镜像中选择元模型导入元模型，您需要特别关注以下参数：元模型来源：选择“从容器镜像中选择”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的特性表1 本版本支持的特性说明分类软件包特性说明参考文档三方大模型，包名：AscendCloud-LLM 支持如下模型适配PyTorch-NPU的训练(ModelLink)

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

如果验证自定义镜像功能成功，结果如下图所示。图3 校验接口上传自定义镜像至SWR服务。完成自定义镜像上传后，您可以在“容器镜像服务>我的镜像>自有镜像”列表中看到已上传镜像。将自定义镜像创建为模型参考从容器镜像中选择元模型导入元模型，您需要特别关注以下参数：元模型来源：选择“从容器镜像中选择”

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询数据集的版本列表 - AI开发平台ModelArts

select：单选下拉列表 values Array of LabelAttributeValue objects 标签属性值列表。表7 LabelAttributeValue 参数参数类型描述 id String 标签属性值ID。 value String 标签属性值。表8 LabelProperty

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 917

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

msprobe API预检 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询数据集版本详情 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

获取Execution列表 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线