搜索_华为云

发布Workflow到AI Gallery - AI开发平台ModelArts

as wf # 添加指定的白名单用户列表 wf.add_whitelist_users(content_id="**", version_num="*.*.*", user_groups=["**", "**"]) # 删除指定的白名单用户列表 wf.delete_whiteli

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

操作。在“专属资源池扩缩容”页面，可通过增减“目标总实例数”实现扩缩容，请用户根据本身业务诉求进行调整。增加目标总实例数即表示扩容，减少目标总实例数即表示缩容。如果购买资源池时，节点数量采用整柜方式购买（部分规格支持），则在扩缩容时为整柜方式扩缩容，目标总实例数等于“数量*整

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
发布数据集到AI Gallery - AI开发平台ModelArts

数据集”下，选择未发布的数据集，单击数据集名称，进入数据集详情页。在数据集详情页，单击右侧“发布”，在发布数据集页面编辑发布信息后，单击“发布”。表1 发布数据集的参数说明参数名称说明中文名称数据集发布后显示的名称，在创建数据集时设置的名称，此处不可编辑。任务类型选择合适的任务类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
更新消息订阅Subscription - AI开发平台ModelArts

/v2/{project_id}/workflows/{workflow_id}/subscriptions/{subscription_id} 表1 路径参数参数是否必选参数类型描述 subscription_id 是 String 消息订阅ID。 project_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
训练精度测试 - AI开发平台ModelArts

cy_cfgs.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_trai

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

cy_cfgs.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_trai

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

utosearch/yaml-templates 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 yaml_templates

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练作业 - AI开发平台ModelArts

String 训练作业选择的资源规格，请参考查询资源规格列表 train_instance_count 是 int 训练作业计算节点个数。 framework_type 否 String 训练作业选择的引擎规格，请参考查询引擎规格列表。 framework_version 否 String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
设置无条件自动重启 - AI开发平台ModelArts

ance/job-retry-num”赋值为1~128之间的任意整数，表示开启自动重启并设置自动重启次数，“fault-tolerance/job-unconditional-retry”赋值为“true”表示启用了无条件自动重启。 { "kind": "job",

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
LoRA微调训练 - AI开发平台ModelArts

Qwen-72B：8 PP 1 非必填。表示流水线并行。默认值为1，取值建议： Qwen-14B：1 Qwen-7B：1 Qwen-72B：大于等于5，例如5机填写5，8机填8。 RUN_TYPE lora 必填。表示训练类型。lora表示LoRA微调。 MASTER_ADDR localhost

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904）
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

/v2/{project_id}/training-job-engines 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 total

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建自动模型优化的训练作业 - AI开发平台ModelArts

契合的超参，提高模型精度和收敛速度。表1 搜索指标参数参数说明名称搜索指标的名称。需要与您在代码中打印的搜索指标参数保持一致。优化方向可选“最大化”或者“最小化”。指标正则填入正则表达式。您可以单击智能生成功能自动获取正则表达式。设置自动化搜索参数从已设置的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
SFT微调训练任务 - AI开发平台ModelArts

Qwen-7B：4 Qwen-72B：8 PP 1 非必填。表示流水线并行。默认值为1，取值建议： Qwen-14B：1 Qwen-7B：1 Qwen-72B：大于等于5，例如5机填写5，8机填8。 RUN_TYPE sft 必填。表示训练类型。sft表示SFT微调。 MASTER_ADDR localhost

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > SFT微调训练
SFT全参微调任务 - AI开发平台ModelArts

一次训练迭代的时长。建议值单机64，双机128。 TP 2 非必填。表示张量并行。默认值为2。 PP 4 非必填。表示流水线并行。建议值单机4，双机8。 RUN_TYPE sft 必填。表示训练类型，sft表示SFT微调训练。 MASTER_ADDR localhost 多机必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

如果出现报错“NCCL timeout”或者“RuntimeError: NCCL communicator was aborted on rank 7”，则表示InfiniBand Verbs超时。单击右侧“重建”，重新创建训练作业，设置环境变量“NCCL_IB_TIMEOUT=22”，提交训练作业后等待作业完成。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

el_name} 表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID label_name 是 String 标签名称。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询工作流定时调度详情 - AI开发平台ModelArts

GET /v2/{project_id}/workflows/{workflow_id}/schedules/{schedule_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
msprobe梯度监控 - AI开发平台ModelArts

"比对结果输出目录") 最终生成结果为similarities.csv表示每个Step各个权重参数两次比对相似度值，以及 {param_name}.png和summary_similarities.png以折线图方式表示各个Step相似度不比对结果。详细工具的使用指导请参考梯度状态监控工具介绍。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
更新标注团队 - AI开发平台ModelArts

s/{workforce_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

RO内存优化等高级特性，以提高训练效率和性能 stage sft 表示当前的训练阶段。可选择值：sft、rm、ppo、dpo。 sft代表指令监督微调； rm代表奖励模型训练； ppo代表PPO训练； dpo代表DPO训练。 finetuning_type full 用于指定微调策略类型，可选择值full、lora。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明

总条数： 2455

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布Workflow到AI Gallery - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

更新消息订阅Subscription - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

SFT微调训练任务 - AI开发平台ModelArts

SFT全参微调任务 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

查询工作流定时调度详情 - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

更新标注团队 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线