搜索_华为云

发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集评估图片类数据集配比图片类数据集流通图片类数据集父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集清洗图片类数据集标注图片类数据集父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
管理加工后的数据集 - 盘古大模型 PanguLargeModels

如果需要彻底删除数据集，可单击数据集名称进入详情页，确认数据集内容后彻底删除该数据集。删除原始数据集属于高危操作，删除前，请确保该数据集不再使用。父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

合成和数据标注关键操作，旨在确保原始数据符合业务需求和模型训练的标准，是数据工程中的核心环节。数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。数据合成利用预置或自

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作，不支持数据加工操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
管理发布后的数据集 - 盘古大模型 PanguLargeModels

如果需要彻底删除数据集，可单击数据集名称进入详情页，确认数据集内容后彻底删除该数据集。删除原始数据集属于高危操作，删除前，请确保该数据集不再使用。父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

0个。网页 html 单个文件大小不超过50GB，文件数量最多1000个。预训练文本 jsonl jsonl格式：text表示预训练所使用的文本数据，具体格式示例如下： {"text":"盘古大模型，是华为推出的盘古系列AI大模型，包括NLP大模型、多模态大模型、CV大模型、科学计算大模型、预测大模型。"}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

b1、grib1、gr2、grb2、grib2 天气数据通常包含全球或区域性的气象变量，如温度（T）、气压（P）、风速（U、V）等。在文件中，这些变量可能按时间、地理范围和气压层次进行组织。示例如下： {"geo_range": {"lat": ["-90.0", "90.0"]

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

rain01.csv；验证数据名称需包含eval字样；测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。时序预测必须要包含一个时间列，时间列值的格式示例为 2024-05-27 或 2024/05/27 或 2024-05-27

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

'classes': [category1',category2', ...],// 所有类别名称的列表，每个类别对应一个 label，用于标注视频中的事件或动作。 'database': { 'video_name':{ // 训练集 train

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
导入数据过程中，为什么无法选中OBS的具体文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的具体文件进行上传在数据导入过程中，平台仅支持通过OBS服务导入文件夹类型的数据，而不支持直接导入单个文件。您需要将文件整理到文件夹中，并选择该文件夹进行上传。父主题：大模型使用类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

[x, y, v]。x和y是关键点的像素坐标，v是可见性（0：不可见且不在图像中；1：不可见但在图像中；2：可见且在图像中）。 image_id 是与该标注相关联的图像的ID，必须与images字段中的id对应。 bbox 是目标物体的边界框，用[x, y, width, h

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
评估文本类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台针对文本类数据集预设了一套基础评估标准，涵盖了数据准确性、完整性、一致性、格式规范等多个维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建文本类数据集评估任务。创建文本类数据集评估标准步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
评估视频类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台针对视频类数据集预设了一套基础评估标准，涵盖了视频的清晰度、帧率、完整性、标签准确性等多个质量维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建视频类数据集评估任务。创建视频类数据集评估标准步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
清洗文本类数据集 - 盘古大模型 PanguLargeModels

在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据清洗任务时，可直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的清洗步骤。图2 选择加工模板清洗步骤编排完

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
流通文本类数据集 - 盘古大模型 PanguLargeModels

平台支持发布不同格式的数据集。当前支持默认格式、盘古格式：默认格式：数据工程功能支持的原始格式。盘古格式：使用盘古大模型训练时所需要使用的数据格式。如果使用该数据集训练盘古大模型，请将选择格式配置为盘古格式。填写数据集名称、描述，设置数据集“资产可见性”，设置扩展信息后，单击“确定”执行数据集流通操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
清洗视频类数据集 - 盘古大模型 PanguLargeModels

在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据清洗任务时，可直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的清洗步骤。图2 选择加工模板清洗步骤编排完

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
清洗气象类数据集 - 盘古大模型 PanguLargeModels

在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据清洗任务时，可直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的清洗步骤。图2 选择加工模板清洗步骤编排完

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工气象类数据集
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

从TXT文件中提取所有文本内容。 CSV内容提取从CSV文件中读取所有文本内容，并按该文件内容类型模板KEY值生成匹配的JSON格式数据。 PDF内容提取从PDF中提取内容转换为结构化数据。 JSON内容提取提取JSON文件中的键值对信息。 HTML内容提取基于标签路径提取HTM

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍

总条数： 230

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的具体文件进行上传 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

评估文本类数据集 - 盘古大模型 PanguLargeModels

评估视频类数据集 - 盘古大模型 PanguLargeModels

清洗文本类数据集 - 盘古大模型 PanguLargeModels

流通文本类数据集 - 盘古大模型 PanguLargeModels

清洗视频类数据集 - 盘古大模型 PanguLargeModels

清洗气象类数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线