搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

/home/ma-user/work/model/llama-2-13b-chat-hf 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。 MODEL_NAME llama2-13b 对应模型名称。 RUN_TYPE pretrain 表示训练类型。可选择值：[pretrain

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
查询Workflow Execution - AI开发平台ModelArts

result String 执行结果。 metric_list Array of WorkflowMetricPair objects 工作流度量信息列表。表9 WorkflowMetricPair 参数参数类型描述 key String 度量信息metric的key。 value Object

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
ModelArts权限管理基本概念 - AI开发平台ModelArts

举例，如果用户需要用OBS中的数据进行训练，当已经为IAM用户配置ModelArts训练权限时，仍需同时为其配置对应的OBS权限（读、写、列表），才可以正常使用。其中OBS的列表权限用于支持用户从ModelArts界面上选择要进行训练的数据路径；读权限主要用于数据的预览以及训练任务执行时的数据读取；写权限则是为了保存训练结果和日志。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

启动数据特征分析任务数据特征分析任务启动后，需执行一段时间，根据数据量不同等待时间不同，请耐心等待。当您选择分析的版本出现在“版本选择”列表下，且可选择时，即表示分析已完成。查看数据特征分析结果。 “版本选择”：在右侧下拉框中选择进行对比的版本。也可以只选择一个版本。 “类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作
配置Workflow参数 - AI开发平台ModelArts

e”，则在使用的相应节点运行时卡点配置。否 bool description 参数描述信息。否 str enum_list 参数枚举值列表，只有当参数类型为PlaceholderType.ENUM时才需要填写。否 list constraint 参数相关的约束配置，当前该字段仅支持训练规格的约束，且用户不感知。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
创建模型不同方式的场景介绍 - AI开发平台ModelArts

和容器镜像中的元模型，可对所有迭代和调试的模型进行统一管理。约束与限制自动学习项目中，在完成模型部署后，其生成的模型也将自动上传至模型列表中。但是自动学习生成的模型无法下载，只能用于部署上线。创建模型、管理模型版本等功能目前是免费开放给所有用户，使用此功能不会产生费用。创建模型的几种场景

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
Standard资源池功能介绍 - AI开发平台ModelArts

如果专属资源池的规格与您的业务不符，可通过扩缩容Standard专属资源池来调整专属资源池的规格。每个用户对集群的驱动要求不同，在专属资源池列表页中，可自行选择加速卡驱动，并根据业务需要进行立即变更或平滑升级。ModelArts提供了自助升级专属资源池GPU/Ascend驱动的能力

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

参数类型描述 total Integer 训练作业引擎规格总数。 items Array of items objects 引擎规格参数列表。表3 items 参数参数类型描述 engine_id String 引擎规格的ID。如“caffe-1.0.0-python2.7”。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

n/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。 MODEL_NAME llama2-70b 对应模型名称。 RUN_TYPE pretrain 表示训练类型。可选择值：[pretrain

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

s”为全局级云服务。了解更多创建用户组并加入用户，步骤请参考Step1 创建用户组并加入用户。给用户组授权策略。在IAM服务的用户组列表页面，单击“授权”，进入到授权页面，为子账号配置权限。勾选“trainJob”和“trainJob-obs”策略。单击“下一步”和“确定”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

举例，如果用户需要用OBS中的数据进行训练，当已经为IAM用户配置ModelArts训练权限时，仍需同时为其配置对应的OBS权限（读、写、列表），才可以正常使用。其中OBS的列表权限用于支持用户从ModelArts界面上选择要进行训练的数据路径；读权限主要用于数据的预览以及训练任务执行时的数据读取；写权限则是为了保存训练结果和日志。

帮助中心 > AI开发平台ModelArts > 产品介绍
查看批量服务的事件 - AI开发平台ModelArts

服务部署和运行过程中，关键事件支持手动/自动刷新。查看操作在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 批量服务”，在服务列表中，您可以单击名称/ID，进入服务详情页面。在服务详情页面，切换到“事件”页签，查看事件信息。父主题：管理批量推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

} ] } 创建用户组并加入用户，步骤请参考Step1 创建用户组并加入用户。给用户组授权策略。在IAM服务的用户组列表页面，单击“授权”，进入到授权页面，为子账号配置权限。勾选步骤2中创建的“ma_sfs_turbo”策略。单击“下一步”和“确定”。在已

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查询服务更新日志 - AI开发平台ModelArts

服务个性化配置。表6 ServiceLogConfig 参数参数类型描述 model_id String 公共参数。模型ID。通过调用查询AI应用列表接口可以获取。 model_name String 模型名称。 model_version String 模型版本。 weight Integer

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查看在线服务的事件 - AI开发平台ModelArts

服务部署和运行过程中，关键事件支持手动/自动刷新。查看操作在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 在线服务”，在服务列表中，您可以单击名称/ID，进入服务详情页面。在服务详情页面，切换到“事件”页签，查看事件信息。父主题：管理同步在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
附录：训练常见问题 - AI开发平台ModelArts

训练时transformers版本要求为4.45.0，训练完成后保存的tokenizer.json文件中的“merges”时保存的是拆开的列表不是字符串，导致推理异常解决措施，以下两种方法任选其一： ①更新transformes和tokenizers版本 GLM4-9B模型，容器内执行以下步骤：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型模型参数量训练类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明

总条数： 1450

上一页
1
...
56
57
58
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

配置Workflow参数 - AI开发平台ModelArts

创建模型不同方式的场景介绍 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线