搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

PyTorch版本：2.3.1 确保容器可以访问公网。文档更新内容 6.3.912版本相对于6.3.911版本新增如下内容：代码结构发生变化，统一了modellink和llama-factory的启动方式。继承911版本启动方式以外增加新的启动方式： ascendfactory-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

rc3，驱动版本是23.0.6。确保集群可以访问公网。文档更新内容 6.3.912版本相对于6.3.911版本新增如下内容：代码结构发生变化，统一modellink和llama-factory的启动方式。继承911版本启动方式以外新加新的启动方式： ascendfactory-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
更新网络资源 - AI开发平台ModelArts

String 系统自动生成的network名称，相当于networkId。networkId指的是ModelArts基于用户输入的网络名称生成的唯一ID值。 creationTimestamp String 时间戳，例如"2021-11-01T03:49:41Z"。 labels NetworkMetadataLabels

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询服务列表 - AI开发平台ModelArts

资源排队中，仅在线服务有这个状态。 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，默认为1000。 sort_by 否 String 指定排序字段，枚举值如下： publish_at: 服务发布时间，默认值

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询数据处理任务的版本列表 - AI开发平台ModelArts

task_id 是 String 数据处理任务ID。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为100。 offset 否 Integer 分页列表的起始页，默认为0。 order 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

使用自定义镜像功能通过torch.distributed.launch命令启动通过torch.distributed.run命令启动创建训练作业方式一：使用PyTorch预置框架功能，通过mp.spawn命令启动训练作业。创建训练作业的关键参数如表1所示。表1 创建训练作业（预置框架）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
调用MaaS部署的模型服务 - AI开发平台ModelArts

Key”，填写描述信息后，单击“确认”会返回“您的密钥”，请复制保存密钥，单击“关闭”后将无法再次查看密钥。最多支持创建5个密钥，密钥只会在新建后显示一次，请妥善保存。当密钥丢失将无法找回，请新建API Key获取新的访问密钥。步骤2：调用MaaS模型服务进行预测在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用MaaS部署模型服务 - AI开发平台ModelArts

使用消息通知服务会产生相关服务费用，详细信息请参见计费说明。自动停止当使用付费资源时，可以选择是否打开“自动停止”开关。开关关闭（默认关闭）：表示服务将一直运行。开关打开：表示启用自动停止功能，此时必须配置自动停止时间，支持设置为“1小时”、“2小时”、“4小时”、6小时或“自定义”。启用该

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

submit命令提交ModelArts训练作业。 ma-cli ma-job submit命令需要指定一个位置参数YAML_FILE表示作业的配置文件路径，如果不指定该参数，则表示配置文件为空。配置文件是一个YAML格式的文件，里面的参数就是命令的option参数。此外，如果用户在命令行中同时

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

从指标源下拉列表选择“Prometheus_AOM_Default”实例。图1 选择指标源通过“全量指标”或“按普罗语句添加”方式选择一个或多个关注的指标。图2 添加指标关于更多指标浏览方法请参考华为云帮助中心“应用运维管理 AOM> 用户指南（2.0）> 指标浏览”。容器级别的指标介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
查询AI应用详情 - AI开发平台ModelArts

restraint String 版本限制条件，当且仅当package_version存在时必填，取值包含： EXACT：和指定的版本完全一致。 ATLEAST：不低于指定的版本。 ATMOST：不高于指定的版本。表8 ModelSpecification 参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
支持的模型列表 - AI开发平台ModelArts

co/HwwwH/MiniCPM-V-2 注意：需要修改源文件site-packages/timm/layers/pos_embed.py，在第46行上面新增一行代码，如下： posemb = posemb.contiguous() #新增 posemb = F.interpolate(posemb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

co/HwwwH/MiniCPM-V-2 注意：需要修改源文件site-packages/timm/layers/pos_embed.py，在第46行上面新增一行代码，如下： posemb = posemb.contiguous() #新增 posemb = F.interpolate(posemb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

co/HwwwH/MiniCPM-V-2 注意：需要修改源文件site-packages/timm/layers/pos_embed.py，在第46行上面新增一行代码，如下： posemb = posemb.contiguous() #新增 posemb = F.interpolate(posemb

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查询训练作业版本详情 - AI开发平台ModelArts

Long 训练作业的版本ID。 version_name String 训练作业的版本名称。 pre_version_id Long 训练作业前一版本的名称。 engine_type integer 训练作业的引擎类型。“engine_type”和“engine_name”对应关系如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

result))) 获取模型权重文件获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：hugging

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
查询开发环境实例详情 - AI开发平台ModelArts

部署参数，当前仅支持Docker，如表6所示。表6 Docker部署参数数据结构说明参数参数类型说明 namespace String SWR组织名称，全局唯一。 image_name String 镜像名称。 image_tag String 镜像标签。 annotations Map<String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）

总条数： 1504

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

查询数据处理任务的版本列表 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

支持的模型列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线