搜索_华为云

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求文本类数据集格式要求图片类数据集格式要求视频类数据集格式要求气象类数据集格式要求预测类数据集格式要求其他类数据集格式要求父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
如何让大模型按指定风格或格式回复 - 盘古大模型 PanguLargeModels

结论”。若希望模型输出遵循特定格式，可以在提示词中明确格式要求，或使用占位符和模板结构，让模型填充内容。例如：请按照以下格式输出：判断原因：xxx 最终结论：xxx 父主题：提示词工程类

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

同，回归分类数据不要求数据具有时间顺序。具体格式要求详见表1。表1 预测类数据集格式要求文件内容文件格式文件样例时序 csv 数据为结构化数据，包含列和行，每一行表示一条数据，每一列表示一个特征，并且必须包含预测目标列，预测目标列要求为连续型数据。目录下只有1个数据文件时，文件无命名要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi 支持mp4、avi视频格式上传，所有视频可以放在多个文件夹

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 ModelArts Studio大模型开发平台支持创建图片类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 图片类数据集格式要求文件内容文件格式文件要求仅图片 tar、图片目录图片：支持jpg、jpeg、png、bmp类型。 ta

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

对特定区域，旨在提供完整、一致且高精度的气象数据。再分析数据为二进制格式，具体格式要求详见表1。表1 气象类数据集格式要求文件内容文件格式文件样例气象-天气数据 nc、cdf、netcdf、gr、gr1、grb、grib、grb1、grib1、gr2、grb2、grib2

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
知识库介绍 - 盘古大模型 PanguLargeModels

之进行互动。知识库支持导入以下格式的本地文档：文本文档数据。支持上传常见文本格式，包括：txt、doc、docx、pdf、ppt、pptx格式。表格数据。支持上传常见的表格文件格式，便于管理和分析结构化数据，包括：xlsx、xls、csv格式。无论是文本文档、演示文稿，还

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
发布文本类数据集 - 盘古大模型 PanguLargeModels

据集能够被这些大模型正常训练，平台支持发布不同格式的数据集。当前支持标准格式、盘古格式：标准格式：数据工程功能支持的原始格式。该格式的数据集可发布到资产中，但下游模型开发不可见。盘古格式：使用盘古大模型训练时所需要使用的数据格式，该数据集将被用于ModelArts Studio大模型开发平台的模型开发中使用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

发布流通是将单个数据集发布为特定格式的“发布数据集”，用于后续模型训练等操作。平台支持发布的数据集格式为默认格式、盘古格式。默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要发布为该格式。当前仅文本类、图片类数据集支持发布为盘古格式。发布文本类数据集父主题：开发盘古NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
发布图片类数据集 - 盘古大模型 PanguLargeModels

数据发布是将数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。图片类数据集支持发布的格式为：标准格式：如图1，平台默认的格式。该格式的数据集可发布到资产中，但下游模型开发不可见。图1 图片类数据集标准格式示例盘古格式：如图2，训练盘古大模型时，需要将数据集格式发布为“盘古

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
常见问题 - 盘古大模型 PanguLargeModels

</dependency> jackson版本要求请见pom.xml。使用java sdk出现json解析报错图1 json解析报错服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

A：先生，您家的网络无法连接是吗 A：请问您尝试重新插拔网线吗？ B：是的，我试了 B：还是不行拼接后的微调数据格式示例： {"context": ["xxx号话务员为您服务！先生您好，有什么可以帮助您的？", "你好，是这样的我家里上不了网了网连不上", "先生，您家的网络无法连接是吗请问您尝试重新插拔网线吗？"]

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
发布预测类数据集 - 盘古大模型 PanguLargeModels

发布预测类数据集预测类数据集当前仅支持发布为“标准格式”，操作步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 发布任务”，单击界面右上角“创建发布任务”。在“创建发布任务”页面，选择数据集模态，如“预测

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

意图识别调用大模型的prompt不符合模型输入的规范。检查输入的prompt格式，消息的角色和内容。 101096 意图识别调用大模型失败。检查消息的格式，内容以及大模型服务是否正常。 101095 意图识别用户query输入/引用解析失败。检查用户query格式和内容。 101094 意图识别prompt模板构建失败。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
发布其他类数据集 - 盘古大模型 PanguLargeModels

发布其他类数据集其他类数据集当前仅支持发布为“标准格式”，操作步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 发布任务”，单击界面右上角“创建发布任务”。在“创建发布任务”页面，选择数据集模态，如“其他

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
发布视频类数据集 - 盘古大模型 PanguLargeModels

发布视频类数据集数据发布是将数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。视频类数据集当前仅支持发布为“标准格式”。创建视频类数据集发布任务创建视频类数据集发布任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
发布气象类数据集 - 盘古大模型 PanguLargeModels

发布气象类数据集气象类数据集当前仅支持发布为“标准格式”，操作步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 发布任务”，单击界面右上角“创建发布任务”。在“创建发布任务”页面，选择数据集模态，如“气象

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集

总条数： 136

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求 - 盘古大模型 PanguLargeModels

如何让大模型按指定风格或格式回复 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

知识库介绍 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

发布文本类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

发布预测类数据集 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

发布其他类数据集 - 盘古大模型 PanguLargeModels

发布视频类数据集 - 盘古大模型 PanguLargeModels

发布气象类数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线