搜索_华为云

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

已经创建好训练作业的日志输出位置，例如“obs://cnnorth4-job-test-v2/pytorch/fast_example/log”。操作步骤调用认证鉴权接口获取用户的Token。请求消息体： URI格式：POST https://{iam_endpoint}/v3/auth/tokens

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
管理训练容器环境变量 - AI开发平台ModelArts

的名称。如何修改环境变量用户可以在创建训练作业页面增加新的环境变量，也可以设置新的取值覆盖当前训练容器中预置的环境变量值。为保证数据安全，请勿输入敏感信息，例如明文密码。训练容器中预置的环境变量训练容器中预置的环境变量如下面表格所示，包括表1、表2、表3、表4、表5、表6、表7。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查询AI应用详情 - AI开发平台ModelArts

package_version String 依赖包版本。不填时默认安装最新版本。不能含有中文及特殊字符&!'"<>=。 package_name String 依赖包名称。请确保包名正确且存在。不能含有中文及特殊字符&!'"<>=。 restraint String 版本限制条件，当且仅当

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
分离部署推理服务 - AI开发平台ModelArts

如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下： df -h Step4 制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
推理性能测试 - AI开发平台ModelArts

本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-3rdLLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，执行如下命令安装性能测试的关依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
推理性能测试 - AI开发平台ModelArts

本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一个c

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
创建Workflow训练作业节点 - AI开发平台ModelArts

如果您在本地IDEA环境中开发工作流，则Session初始化使用如下方式 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HU

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
yaml配置文件参数配置说明 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时，对应的存放绝对或相对路径。请根据实际规划修改。 do_train true 指示脚本执行训练步骤，用来控制是否进行模型训练的。如果设置为true，则会进行模型训练；如果设置为false，则不会进行模型训练。 cutoff_len 4096

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

DistributedDataParallel(Net().cuda()) ### DistributedDataParallel End ### 多节点分布式调测适配及代码示例在DistributedDataParallel中，不同进程分别从原始数据中加载batch的数据，最终将各个进程的梯度进行平均作为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
开发Workflow的核心概念介绍 - AI开发平台ModelArts

象，常用于模型注册场景 ServiceInputPlaceholder：用于定义在运行时需要确定服务部署所需的模型相关信息，只用于服务部署及服务更新场景 DataSelector：支持多种数据类型的选择，当前仅支持在JobStep节点中使用（仅支持选择OBS或者数据集）数据选择对象：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
数据管理（旧版） - AI开发平台ModelArts

分页查询团队标注任务下的样本列表查询团队标注的样本信息查询数据集标签列表创建数据集标签批量修改标签批量删除标签按标签名称更新单个标签按标签名称删除标签及仅包含此标签的文件批量更新样本标签查询数据集的团队标注任务列表创建团队标注任务查询团队标注任务详情启动团队标注任务更新团队标注任务

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

shape的输入。动态batch 在模型转换阶段通过--configFile参数指定配置文件，并且在配置文件中配置input_shape及dynamic_dims动态参数。其中input_shape的-1表示动态shape所在的维度，dynamic_dims指定动态维度的取值范围，例如“[1~4]

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

file文件组网两种方式。当配置了环境变量MS_RANKTABLE_ENABLE="True"，则msrun会读取rank table file文件内容进行组网。否则默认使用动态组网。 msrun使用如下命令启动训练作业的“启动文件”。 msrun --worker_num=${msrun_worker_num}

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

MindSpore：MindSpore 2.3.0 FrameworkPTAdapter：6.0.RC3 如果用到CCE，版本要求是CCE Turbo v1.28及以上 300iDUO 西南-贵阳一 PyTorch： swr.cn-southwest-2.myhuaweicloud.com/atelie

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保容器可以访问公网。 DevServer驱动版本要求23.0.5 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表及权重文件地址支持模型 Template 支持模型参数量权重文件获取地址 Llama3 llama3 llama3-8b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step4 制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一个conda环境。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

、2_convert_mg_hf.sh中的具体python指令，并在Notebook环境中运行执行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。若用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以llama2-13b预训练为例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

1_preprocess_data.sh 、2_convert_mg_hf.sh 中的具体python指令运行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。若用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以 llama2-70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
查询模型对象列表 - AI开发平台ModelArts

del_size”，默认是可选“create_at”。 order 否 String 排序方式，可选“asc”或“desc”，代表递增排序及递减排序，默认是“desc”。 workspace_id 否 String 工作空间ID，默认为“0”。表2 get_model_list打印参数说明

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询服务列表 - AI开发平台ModelArts

ice_name”，默认可选“publish_at”。 order 否 String 排序方式，可选“asc”或“desc”，代表递增排序及递减排序，默认为：“desc”。 model_id 否 String 模型ID，默认不过滤模型ID。表2 get_service_list返回参数说明

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 1110

上一页
1
...
51
52
53
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

数据管理（旧版） - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线