搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
批量更新团队标注样本的标签 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 标注任务ID。请求参数表2 请求Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
提交验收任务的样本评审意见 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 标注任务ID。请求参数表2 请求Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量删除标注团队成员 - AI开发平台ModelArts

id}/workers/batch-delete 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量对节点功能上锁 - AI开发平台ModelArts

l_name}/nodes/batch-lock 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池ID。取值资源池详情的metadata.name字段。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备数据（可选） - AI开发平台ModelArts

ata.json.json）按照下面的数据存放目录要求放置。指令微调样例数据集alpaca_gpt4_data.json.json的下载链接：https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpaca

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
准备数据（可选） - AI开发平台ModelArts

ata.json.json）按照下面的数据存放目录要求放置。指令微调样例数据集alpaca_gpt4_data.json.json的下载链接：https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpaca

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

dataset_id 是 String 数据集ID label_name 是 String 标签名称。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 delete_source 否 Boolean

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询插件模板 - AI开发平台ModelArts

es/{plugintemplate_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 plugintemplate_name 是 String 插件模板的名称。可选值如下： gp

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
分页查询智能任务列表 - AI开发平台ModelArts

学习”和“预标注”两类。 “主动学习”表示系统将自动使用半监督学习、难例筛选等多种手段进行智能标注，降低人工标注量，帮助用户找到难例。 “预标注”表示选择用户模型管理里面的模型进行智能标注。 “自动分组”是指先使用聚类算法对未标注图片进行聚类，再根据聚类结果进行处理，可以分组打标或者清洗图片。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量更新样本标签 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 email 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业列表 - AI开发平台ModelArts

分组条件键对应值。表3 get_job_list返回参数说明参数参数类型描述 total Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的限制量。最小为1，最大为50。 offset

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练的数据集预处理说明 - AI开发平台ModelArts

继承想要的通用的父类，实现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/1_preprocess_data.sh 脚本，自定义环境变量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

继承想要的通用的父类，实现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/1_preprocess_data.sh 脚本，自定义环境变量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
无法导入模块 - AI开发平台ModelArts

module_file.py 训练作业导入模块时日志出现“ImportError: No module named xxx”的报错，可以判断是环境中没有包含用户依赖的python包。处理方法训练作业导入模块时日志出现前两条报错信息，处理方法如下：首先保证被导入的module中有“__init__

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建训练作业标签 - AI开发平台ModelArts

ning_job_id}/tags/create 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练实验 - AI开发平台ModelArts

/v2/{project_id}/training-experiments/ 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 metadata 是 Tr

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询资源池上的标签 - AI开发平台ModelArts

/v1/{project_id}/pools/{pool_name}/tags 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。取自资源池详情的metadata字段中的name的值。

帮助中心 > AI开发平台ModelArts > API参考 > 资源标签管理
准备数据（可选） - AI开发平台ModelArts

pt4_data.json.json）按照下面的数据存放目录要求放置。指令微调样例数据集alpaca_gpt4_data.json的下载链接：https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpaca

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 2275

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

提交验收任务的样本评审意见 - AI开发平台ModelArts

批量删除标注团队成员 - AI开发平台ModelArts

批量对节点功能上锁 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

查询插件模板 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

创建训练作业标签 - AI开发平台ModelArts

创建训练实验 - AI开发平台ModelArts

查询资源池上的标签 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线