搜索_华为云

合成文本类数据集 - 盘古大模型 PanguLargeModels

成任务。当数据合成任务运行成功后，状态将从“运行中”变为“运行成功”，表示数据已经完成合成操作。在完成数据合成后，若无需使用数据标注、数据配比功能，可直接在“合成任务”页面单击操作列“生成”，生成加工数据集。生成的加工数据集可在“数据工程 > 数据管理 > 数据集 > 加工数据集”中查看。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
数据集加工算子介绍 - 盘古大模型 PanguLargeModels

数据集加工算子介绍文本类加工算子介绍视频类加工算子介绍图片类加工算子介绍气象类加工算子介绍父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
标注视频类数据集 - 盘古大模型 PanguLargeModels

在完成数据标注后，如果无需进行标注审核，可直接在“数据标注 > 任务管理”页面单击“生成”，生成加工数据集。生成的加工数据集可在“数据工程 > 数据管理 > 数据集 > 加工数据集”中查看。审核标注后的视频类数据集如果在创建视频类数据集标注任务时启用了标注审核功能，则在完成标注后

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi 支持mp4、avi视频格式上传，所有视频可以放在多个文件夹

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
管理发布后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据管理 > 数据集 > 发布数据集”。单击数据集名称查看发布数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看发布后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成、训练等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至发布图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
标注图片类数据集 - 盘古大模型 PanguLargeModels

在完成数据标注后，如果无需进行标注审核，可直接在“数据标注 > 任务管理”页面单击“生成”，生成加工数据集。生成的加工数据集可在“数据工程 > 数据管理 > 数据集 > 加工数据集”中查看。审核标注后的图片类数据集如果在创建图片类数据集标注任务时启用了标注审核功能，则在完成标注后

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 发布任务”，单击界面右上角“创建发布任务”。在“创建发布任务”页面，选择数据集模态，如“图片 > 图片+Caption”类型的数据集。图3 选择数据集模态选择数据集，单击“下一步”。在“基本配置”中选择数据用途、数据集可见性、适用场景。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集发布图片类数据集前，ModelArts Studio大模型开发平台支持对数据集进行评估操作，帮助用户优化数据质量，确保数据满足高标准，提升模型性能。如果无需使用数据评估操作，可跳过此章节至发布图片类数据集。创建图片类数据集评估标准 ModelArts Stu

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
气象类加工算子介绍 - 盘古大模型 PanguLargeModels

气象类加工算子介绍平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

总体而言，数据加工不仅提升了数据处理的效率，还可通过优化数据质量和针对性处理，支持高效的模型训练。通过数据加工，用户能够快速构建高质量的数据集，推动大模型的成功开发。支持数据加工的数据集类型当前支持数据加工操作的数据集类型见表1。表1 支持数据加工操作的数据集类型数据类型数据加工

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 ModelArts Studio平台支持从OBS服务导入数据。您可以将本地数据上传至OBS（对象存储服务），然后通过平台提供的“数据导入”功能，将存储在OBS中的数据导入至平台进行使用。具体操作步骤如下：上传数据至OBS：将本地数据上传至OBS服务，请详见通过控制台快速使用OBS。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类
构建微调训练任务数据集 - 盘古大模型 PanguLargeModels

构建微调训练任务数据集获取源数据科学计算大模型微调训练所需的数据为气象再分析数据。气象再分析数据集是利用现代数值天气预报模型和数据同化系统，对过去的观测数据进行重新处理后得到的。这些数据集可以是全球范围的，也可以是特定区域的。再分析数据集的目的是通过整合历史观测数据和现代计算技

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
认证鉴权 - 盘古大模型 PanguLargeModels

证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。 SK(Secret Access Key)：与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。使用A

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集加工图片类数据集标注图片类数据集配比图片类数据集父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集评估图片类数据集发布图片类数据集父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案数据工程常见报错及解决方案请详见表1。表1 数据工程常见报错与解决方案功能模块常见报错解决方案数据获取 File format mismatch, require [{0}]. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传当前，ModelArts Studio平台针对不同类别的数据集可使用OBS服务导入的文件形式不同：文本、视频、预测和其他类（自定义）数据集支持文件夹或单个文件导入，导入界面提示用户：“请选择文件夹或文件”。图1 支持导入单个文件示例

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类

总条数： 178

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

合成文本类数据集 - 盘古大模型 PanguLargeModels

数据集加工算子介绍 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

气象类加工算子介绍 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

构建微调训练任务数据集 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线