搜索_华为云

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 ModelArts在数据准备过程中，针对同一数据源的数据，对不同时间处理或标注后的数据，按照版本进行区分方便后续模型构建和开发时选择对应的数据集版本进行使用。关于数据集版本针对刚创建的数据集（未发布前），无数据集版本信息，必须执行发布操作后，才能应用于模型开发或训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

及其说明。数据特征分析登录ModelArts管理控制台，在左侧菜单栏中选择“数据管理>数据集”，进入“数据集”管理页面。选择对应的数据集，单击操作列的“更多 > 数据特征”，进入数据集概览页的数据特征页面。您也可以在单击数据集名称进入数据集概览页后，单击“数据特征”页签进入。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
导出ModelArts数据集中的数据到OBS - AI开发平台ModelArts

导出ModelArts数据集中的数据到OBS 针对数据集中的数据，用户可以选中部分数据或者通过条件筛选出需要的数据，当需要将数据集中的数据存储至OBS用于后续导出使用时，可通过此种方式导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。目前只有“图像分类”、“物体检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

入门案例：快速创建一个物体检测的数据集本节以准备训练物体检测模型的数据为例，介绍如何针对样例数据，进行数据分析、数据标注等操作，完成数据准备工作。在实际业务开发过程中，可以根据业务需求选择数据管理的一种或多种功能完成数据准备。此次操作分为以下流程：准备工作创建数据集数据分析数据标注数据发布数据导出

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据数据集版本发布失败数据集版本不合格父主题：自动学习

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习
准备预测分析数据 - AI开发平台ModelArts

后就可以将.xlsx格式数据集转换为.csv格式。表格数据集对训练数据的要求：训练数据列数一致，总数据量不少于100条不同数据（有一个特征取值不同，即视为不同数据）。训练数据列内容不能有时间戳格式（如：yy-mm-dd、yyyy-mm-dd等）的数据。如果某一列的取值只有

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
标注声音分类数据 - AI开发平台ModelArts

标注声音分类数据项目创建完成后，将会自动跳转至新版自动学习页面，并开始运行，当数据标注节点的状态变为“等待操作”时，需要手动进行确认数据集中的数据标注情况，也可以对数据集中的数据进行标签的修改，数据的增加或删减。图1 数据标注节点状态音频标注在新版自动学习页面单击“实例详

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
配置Grafana数据源 - AI开发平台ModelArts

配置Grafana数据源在Grafana配置数据源后，即可通过Grafana查看ModelArts的监控数据。前提条件已安装Grafana。配置Grafana数据源获取Grafana数据源配置代码。进入AOM管理控制台。图1 AOM管理控制台在左侧导航栏中选择“Prometheus监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
创建数据集 - AI开发平台ModelArts

"dataset-image" # 数据集名称 data_type = "IMAGE" # 数据集类型，图像类型数据集 data_sources = dict() # 数据集数据来源 data_sources["type"] = 0 # 数据来源类型，0表示OBS

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
从Manifest文件导入数据到数据集 - AI开发平台ModelArts

图1 导入manifest文件导入成功后，数据将自动同步到数据集中。您可以在“数据集”页面，单击数据集的名称，查看详细数据，并可以通过创建标注任务进行数据标注。文件型数据标注状态数据标注状态分为“未标注”和“已标注”。未标注：仅导入标注对象（指待标注的图片，文本等），不导入标注内容（指标注结果信息）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
人工标注视频数据 - AI开发平台ModelArts

栏中选择“数据管理> 数据标注”，进入“数据标注”管理页面。在标注作业列表右侧“所有类型”页签下拉选择标注类型，基于“标注类型”选择需要进行标注的标注作业，单击标注作业名称进入标注作业标注详情页。图1 下拉选择标注类型在标注作业标注详情中，展示此标注作业下全部数据。标注视频

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

调用创建数据集接口创建一个图像分类类型的数据集。调用查询数据集详情接口根据数据集ID查询数据集的详情。调用查询样本列表接口根据数据集ID获取数据集的样本详情。调用批量更新样本标签接口根据数据集ID和样本ID给样本添加标签进行人工标注。调用查询数据集的统计信息接口查看数据集的标注统计信息。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
管理和查看数据处理任务 - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧的导航栏中选择“数据管理>数据处理”，进入“数据处理”页面。在数据处理列表中，单击数据处理任务名称，进入数据处理任务的版本管理页面。您可以在该页面进行数据处理任务的“修改”与“删除”。图1 数据处理版本管理页面您可以在版本管理页面，通过切换页签查看“配置信息”、“日志”和“结果展示”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
导入数据到ModelArts数据集 - AI开发平台ModelArts

导入数据到ModelArts数据集数据导入方式介绍从OBS导入数据到ModelArts数据集从DWS导入数据到ModelArts数据集从DLI导入数据到ModelArts数据集从MRS导入数据到ModelArts数据集从本地上传数据到ModelArts数据集父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
SFT微调数据处理 - AI开发平台ModelArts

SFT微调和LoRA微调训练使用的是同一个数据集，数据处理一次即可，训练时可以共用。数据预处理说明使用数据预处理脚本preprocess_data.py脚本重新生成.bin和.idx格式的SFT全参微调数据。preprocess_data.py存放在llm_train/As

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT微调训练
如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？查询cuda版本： cat /usr/local/cuda/version.txt 查询cudnn版本： cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
标注ModelArts数据集中的数据 - AI开发平台ModelArts

标注ModelArts数据集中的数据数据标注场景介绍通过人工标注方式标注数据通过智能标注方式标注数据通过团队标注方式标注数据管理标注作业父主题：数据准备与处理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前指令微调数据集支持alpaca格式和sharegpt格式的数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
管理AI Gallery数据集 - AI开发平台ModelArts

管理AI Gallery数据集编辑数据集介绍资产发布上架后，准确、完整的资产介绍有助于提升资产的排序位置和访问量，能更好的支撑用户使用该资产。在数据集详情页，选择“数据集介绍”页签，单击右侧“编辑介绍”。编辑数据集基础设置和数据集描述。表1 数据集介绍的参数说明参数名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
预训练数据处理 - AI开发平台ModelArts

ment.idx文件。图1 处理后的数据自定义数据如果是用户自己准备的数据集，可以使用Ascendspeed代码仓中的转换工具将json格式数据集转换为训练中使用的.idx + .bin格式。 #示例 #1.将准备好的json格式数据集存放于/home/ma-user/ws

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练

总条数： 1757

上一页
1
...
6
7
8
...
88
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

导出ModelArts数据集中的数据到OBS - AI开发平台ModelArts

入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

标注声音分类数据 - AI开发平台ModelArts

配置Grafana数据源 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

从Manifest文件导入数据到数据集 - AI开发平台ModelArts

人工标注视频数据 - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

管理和查看数据处理任务 - AI开发平台ModelArts

导入数据到ModelArts数据集 - AI开发平台ModelArts

SFT微调数据处理 - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

标注ModelArts数据集中的数据 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线