搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

指令微调数据：如上述提供的 alpaca_gpt4_data.json 数据集，数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
创建数据集 - AI开发平台ModelArts

表2 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。 work_path 是表6 数据集输出位置，用于存放输出的标注信息等文件。 labels 否 List

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

指令微调数据：如上述提供的 alpaca_gpt4_data.json 数据集，数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

指令微调数据：如上述提供的 alpaca_gpt4_data.json 数据集，数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
创建ModelArts数据集 - AI开发平台ModelArts

以及数据标注要求，选择创建表格类型的数据集。填写数据集基本信息。图5 表格类型的参数名称：数据集的名称，可自定义您的数据集。描述：该数据集的详情信息。数据类型：根据实际需求，选择对应的数据类型。更多参数填写请参考表3。表3 数据集的详细参数参数名称说明数据源（“OBS”）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
资源池监控 - AI开发平台ModelArts

startTimeInMillis: 查询的开始时间，格式为UTC毫秒，如果指定为-1，服务端将按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间 endTimeInMillis: 查询的结束时间，格式为UTC毫秒，如果指定

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询单个智能标注样本的信息 - AI开发平台ModelArts

8：图像的饱和度与训练数据集的特征分布存在较大偏移。 9：图像的色彩丰富程度与训练数据集的特征分布存在较大偏移。 10：图像的清晰度与训练数据集的特征分布存在较大偏移。 11：图像的目标框数量与训练数据集的特征分布存在较大偏移。 12：图像中目标框的面积标准差与训练数据集的特征分布存在较大偏移。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

scope参数定义了Token的作用域，示例中获取的Token仅能访问project下的资源。Modelarts使用区域的Endpoint（非全局域名）调用该接口，推荐您将scope设置为project。您还可以设置Token作用域为某个账号下所有资源或账号的某个project下的资源，详细定义请参见获取用户Token。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

到指定的obs_path中；将训练作业提交到ModelArts训练服务中，训练作业会使用当前Notebook的镜像来执行训练作业；训练任务得到的输出上传到4指定的obs_path中，日志上传到log_url指定的位置中。在这一步中需要注意的一个问题：如果用户在自己的训练脚

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

OBS目录中的文件创建训练作业。如果选择通过数据集作为训练作业的数据源，则需要指定数据集及特定的版本。因此，用户需要为准备好的数据发布一个版本，具体操作参考发布ModelArts数据集中的数据版本。为了便于后期的模型构建和开发，对同一数据源来说，将其不同时间对数据的处理和标注按

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
创建ModelArts数据校验任务 - AI开发平台ModelArts

} ] } 数据输出的data文件夹中存放的是修改、更新过的图片，对于数据处理过程中没有修改过的图片，在data文件夹中不会展示，图片的位置信息显示该图片在输入目录中。 output.manifest存放的是数据处理之后的图片信息（主要是指图片的位置和标注信息等），可以直接使用这个output

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
创建处理任务 - AI开发平台ModelArts

两大类任务。可通过指定请求体中的复合参数“template”的“id”字段来创建某类任务。 “特征分析”是指基于图片或目标框对图片的各项特征，如模糊度、亮度进行分析，并绘制可视化曲线，帮助处理数据集。 “数据处理”是指从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为 instruction\ninput。 output：生成的指令的答案。 system：系统提

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
管理标注数据 - AI开发平台ModelArts

添加了此标签的图片，都将被标注为新的标签名称。删除标签：单击操作列“删除”，之前添加了此标签的图片，都将删除此标签。图3 标签管理图4 全部标签的信息单击标注作业操作列的“标签”，可跳转至标签管理页。单击操作列的“修改”，即可完成标签的修改。单击操作列的“删除”，即可删除该标签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
查询数据集导出任务列表 - AI开发平台ModelArts

导出类型，不传则默认查询所有类型的导出任务。可选值如下： 0：已标注 1：未标注 2：全部 3：条件筛选 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为10。 offset 否 Integer 分页列表的起始页，默认为0。请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询处理任务列表 - AI开发平台ModelArts

pe”参数来单独查询某类任务的列表。 “特征分析”是指基于图片或目标框对图片的各项特征，如模糊度、亮度进行分析，并绘制可视化曲线，帮助处理数据集。 “数据处理”是指从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的人们来说是有价值、有意义的数据。“数据处理”又分为“数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
pipeline代码适配 - AI开发平台ModelArts

pipeline的主要作用是将onnx模型进行一系列编排，并在onnx Runtime上按照编排顺序执行。因此，需要将转换得到的mindir模型按照相同的逻辑进行编排，并在MindSpore Lite上执行。只需要将原始onnx的pipeline中涉及到onnx模型初始化及推理的接口替换为MindSpore

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
创建数据集导出任务 - AI开发平台ModelArts

数据集版本ID。当导出数据集某一版本的数据时，需要指定该参数。 with_column_header 否 Boolean 导出时是否将列名写到CSV文件的第一行，对于表格数据集有效。可选值如下： true：导出时将列名写到CSV文件的第一行（默认值） false：导出时不将列名写到CSV文件的第一行表3

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

物理专属池对应的资源池id。 pool_name 物理专属池对应的资源池name。 logical_pool_id 逻辑子池的id。 logical_pool_name 逻辑子池的name。 gpu_uuid 容器使用的GPU的UUID。 gpu_index 容器使用的GPU的索引。 gpu_type

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
创建数据集 - AI开发平台ModelArts

of DataSource objects 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。目前仅支持传入单个DataSource。 dataset_name

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1703

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

创建ModelArts数据集 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

管理标注数据 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线