搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置本代码包中集成了不同模型的训练脚本，并可通过不同模型中的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。如果未完成，则执行脚本，自动完成数据预处理和权重转换的过程。如果用户进行自定义数据集预处理以及权重转换，可通过编辑 1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置本代码包中集成了不同模型的训练脚本，并可通过不同模型中的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。若未完成，则执行脚本，自动完成数据预处理和权重转换的过程。若用户进行自定义数据集预处理以及权重转换，可通过编辑 1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
测试用户权限 - AI开发平台ModelArts

果能正常打开页面，表示当前用户具备DEW的操作权限。验证OBS权限。在左上角的服务列表中，选择OBS服务，进入OBS管理控制台。在OBS管理控制台，单击右上角的“创建桶”，如果能正常打开页面，表示当前用户具备OBS的操作权限。验证SWR权限。在左上角的服务列表中，选择SWR服务，进入SWR管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置本代码包中集成了不同模型的训练脚本，并可通过不同模型中的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。如果未完成，则执行脚本，自动完成数据预处理和权重转换的过程。如果用户进行自定义数据集预处理以及权重转换，可通过编辑 1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
查询数据集列表 - AI开发平台ModelArts

查询第51-100条记录 print(dataset_list) 参数说明表1 请求参数参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参见Session鉴权。 dataset_type 否 Integer 根据数据集类型查询数据集列表，默认为空。可选值如下：

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
查询训练作业版本详情 - AI开发平台ModelArts

String 训练作业的数据集版本ID。 type String 数据集类型。 “obs”：表示使用OBS的数据。 “dataset”：表示使用数据集的数据。 data_url String OBS的桶路径。表5 model_metric_list属性列表参数参数类型说明

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
停止训练作业版本 - AI开发平台ModelArts

此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI POST /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/stop 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

AM用户不具备对应存储位置（OBS桶）的操作权限。解决方法：使用账号登录OBS，并将对应OBS桶的访问权限授予该IAM用户。详细操作指导请参见：被授权用户。 IAM用户获得权限后，登录ModelArts管理控制台，删除该实例，然后重新使用此OBS路径创建Notebook实例。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
查询可视化作业详情 - AI开发平台ModelArts

可视化作业输出文件OBS路径。 status Int 可视化作业的运行状态，详细作业状态列表请参见作业状态参考。请求示例如下以查询作业ID为10的可视化作业为例。 GET https://endpoint/v1/{project_id}/visualization-jobs/10 响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
更新可视化作业描述 - AI开发平台ModelArts

更新可视化作业描述功能介绍更新可视化作业的描述。 URI PUT /v1/{project_id}/visualization-jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否为必选参数类型说明 project_id 是 String 用户项目

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
模型配置文件编写说明 - AI开发平台ModelArts

模型配置文件编写说明模型开发者发布模型时需要编写配置文件config.json。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件格式说明配置文件为JSON格式，参数说明如表1所示。表1 参数说明参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Cluster上的训练方案。训练框架使用的是ModelLink。本方案目前仅适用于企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
准备镜像环境 - AI开发平台ModelArts

end:20240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模板，用于配置pod。而在训练中，需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
配置用户缺失的服务权限 - AI开发平台ModelArts

示，请您及时处理。如果未处理，会导致部分功能出现异常。添加依赖服务授权由于大模型即服务平台的数据存储、模型导入以及部署上线等功能依赖OBS、SW等服务，需获取依赖服务授权后才能正常使用相关功能。如果您未配置依赖服务授权，MaaS控制台顶部会出现获取依赖服务授权提示。您可以单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
更新训练作业描述 - AI开发平台ModelArts

更新训练作业描述功能介绍更新训练作业的描述。 URI PUT /v1/{project_id}/training-jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
Yaml配置文件参数配置说明 - AI开发平台ModelArts

learning_rate 2.0e-5 指定学习率 disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

learning_rate 2.0e-5 指定学习率 disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
管理标注作业 - AI开发平台ModelArts

时间范围。文件名或目录：根据文件名称或者文件存储目录筛选。标注人：选择执行标注操作的账号名称。样本属性：表示自动分组生成的属性。只有启用了自动分组任务后才可使用此筛选条件。数据属性：暂不支持。图2 筛选条件父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
Yaml配置文件参数配置说明 - AI开发平台ModelArts

learning_rate 2.0e-5 指定学习率 disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明

总条数： 1870

上一页
1
...
79
80
81
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

查询可视化作业详情 - AI开发平台ModelArts

更新可视化作业描述 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

配置用户缺失的服务权限 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

管理标注作业 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线