搜索_华为云

合成文本类数据集 - 盘古大模型 PanguLargeModels

任务。当数据合成任务运行成功后，状态将从“运行中”变为“运行成功”，表示数据已经完成合成操作。在完成数据合成后，若无需使用数据标注功能，可直接在“数据合成”页面单击操作列“生成”，生成加工数据集。加工数据集列表可在“数据工程 > 数据加工 > 加工数据集”中查看。创建自定义数据合成指令

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
数据工程 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，支持的数据类型包括文本、图片、视频、气象、预测数据以及用户自定义的其他类型数据。平台提供灵活的数据接入方式以及支持多种文件格式导入，确保不同业务场景下的数据获取需求得到满足。数据清洗：平台提供强大的数据清洗功能，可以对文本、视频、图片、气象类型的数据进行数据提取、过滤、转

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
清洗文本类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，如果无需使用数据合成与数据标注功能，可直接在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
流通文本类数据集 - 盘古大模型 PanguLargeModels

填写数据集名称、描述，设置数据集“资产可见性”，设置扩展信息后，单击“确定”执行数据集流通操作。当任务状态显示为“运行成功”时，说明数据流通任务执行成功，生成的“发布数据集”可在“数据工程 > 数据发布 > 发布数据集”中查看。父主题：发布文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
标注文本类数据集 - 盘古大模型 PanguLargeModels

过”逐一对数据进行审核，直至所有数据审核完成。审核过程中可开启“标注前后对比”功能，查看当前数据标注前后的内容。在完成数据标注审核后，需在“数据标注 > 任务管理”页面单击“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
数据工程介绍 - 盘古大模型 PanguLargeModels

通过这些功能，用户可以轻松将大量数据导入平台，为后续的数据加工和模型训练等操作做好准备。数据加工：平台提供了数据清洗、数据合成、数据标注的加工操作，旨在确保原始数据能够满足各种业务需求和模型训练的标准。数据清洗：数据清洗旨在通过使用数据集清洗算子对数据进行预处理操作，针对不同类型的数据集，平台设计

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
标注图片类数据集 - 盘古大模型 PanguLargeModels

过”逐一对数据进行审核，直至所有数据审核完成。审核过程中可开启“标注前后对比”功能，查看当前数据标注前后的内容。在完成数据标注审核后，需在“数据标注 > 任务管理”页面单击“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
清洗视频类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，如果无需使用数据标注功能，可直接在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工视频类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
清洗图片类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，如果无需使用数据标注功能，可直接在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工图片类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
标注视频类数据集 - 盘古大模型 PanguLargeModels

过”逐一对数据进行审核，直至所有数据审核完成。审核过程中可开启“标注前后对比”功能，查看当前数据标注前后的内容。在完成数据标注审核后，需在“数据标注 > 任务管理”页面单击“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集数据工程介绍数据工程使用流程数据集格式要求导入数据至盘古平台加工数据集发布数据集数据工程常见报错与解决方案

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
数据工程使用流程 - 盘古大模型 PanguLargeModels

从而精确优化数据质量，确保数据满足高标准，提升模型性能。配比数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。流通数据集数据流通是将单个数据集发布为特定格式的“发布数据集”，用于后续模型训练等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

jsonl 训练NLP大模型所需数据量使用数据工程构建盘古NLP大模型数据集进行模型训练时，所需数据量见表2。表2 构建NLP大模型所需数据量模型规格训练类型推荐数据量最小数据量（数据条数）单场景推荐训练数据量单条数据Token长度限制 N1 微调 - 1000条/每场景

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
清洗气象类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工气象类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工气象类数据集
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 CV大模型支持接入的数据集类型盘古CV大模型支持接入图片类、视频类、其他类数据集，，不同模型所需数据见表1，数据集格式要求请参见图片类数据集格式要求、视频类数据集格式要求、其他类数据集格式要求。表1 训练CV大模型数据集类型要求基模型训练场景

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
管理加工后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据加工 > 加工数据集”。单击数据集名称查看加工数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看加工后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据获取 > 原始数据集”，单击需要查看的数据集名称。查看数据集基本信息。在“基本信息”页签，可以查看数据详情、数据来源以及扩展信息。下载原始数据集。在“数据预览”页签，可以查看数据内容，单击右上角“下载”即可下载原始数据集。查看数据血缘。在“数据血缘”

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据保护技术 - 盘古大模型 PanguLargeModels

数据保护技术盘古大模型服务通过多种数据保护手段和特性，保障存储在服务中的数据安全可靠。表1 盘古大模型的数据保护手段和特性数据保护手段简要说明传输加密（HTTPS）盘古服务使用HTTPS传输协议保证数据传输的安全性。基于OBS提供的数据保护基于OBS服务对用户的数

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
管理发布后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 发布数据集”。单击数据集名称查看发布数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看发布后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集

总条数： 205

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

合成文本类数据集 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

清洗文本类数据集 - 盘古大模型 PanguLargeModels

流通文本类数据集 - 盘古大模型 PanguLargeModels

标注文本类数据集 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

清洗视频类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

清洗气象类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

数据保护技术 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线