搜索_华为云

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，before文件夹：包含变化前的图片，每幅图片需与变化后的图片同名、同尺寸。 after文件夹：包含变化后的图片，每幅图片需与变化前的图片同名、同尺寸。 label文件夹：包含与变化前和变化后图片同名、同尺寸的PNG文件。每个像素值代表该位置对应的类别信息，类别应是连续的且从0开始。视频分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

预设的人设风格回答问题。以下示例要求模型以幼儿园老师的风格回答问题： { "messages": [ { "role": "system", "content": "请用幼儿园老师的口吻回答问题，注意语气温和亲切，通过

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi 支持mp4、avi视频格式上传，所有视频可以放在多个文件夹

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求平台支持创建预测类数据集，创建时可导入时序数据、回归分类数据。时序数据：时序预测数据是一种按时间顺序排列的数据序列，用于预测未来事件或趋势，过去的数据会影响未来的预测。回归分类数据：回归分类数据包含多种预测因子（特征），用于预测连续变量的值，与时序数据不

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 CV大模型支持接入的数据集类型盘古CV大模型支持接入图片类、视频类、其他类数据集，，不同模型所需数据见表1，数据集格式要求请参见图片类数据集格式要求、视频类数据集格式要求、其他类数据集格式要求。表1 训练CV大模型数据集类型要求基模型训练场景文件内容文件格式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
如何让大模型按指定风格或格式回复 - 盘古大模型 PanguLargeModels

解并捕捉预期风格。可以在提示词中，明确描述回复风格的要求。例如，若希望模型回答更精炼，可以提示：你的回复“需要简洁精炼”、“仅包括最重要的信息”或“专注于主要结论”。若希望模型输出遵循特定格式，可以在提示词中明确格式要求，或使用占位符和模板结构，让模型填充内容。例如：请按照以下格式输出：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作，不支持数据加工操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

对特定区域，旨在提供完整、一致且高精度的气象数据。再分析数据为二进制格式，具体格式要求详见表1。表1 气象类数据集格式要求文件内容文件格式文件样例气象-天气数据 nc、cdf、netcdf、gr、gr1、grb、grib、grb1、grib1、gr2、grb2、grib2

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求文本类数据集格式要求图片类数据集格式要求视频类数据集格式要求气象类数据集格式要求预测类数据集格式要求其他类数据集格式要求父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

ng Face团队推出的一种大模型请求格式。接口的响应体需要按照jsonpath语法要求进行填写，jsonpath语法的作用是从响应体的json字段中提取出所需的数据。评测配置评测类型选择“自动评测”。评测规则选择“基于规则”。评测数据集评测模板：使用预置的专业数据集进行评测。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

训练预测大模型时，所需的数据通常为表格格式，即由行和列组成的扁平化数据。具体要求如下：行：每行代表一个样本。每行与其他行具有相同的列，并且顺序相同，这些行通常按照某种特定顺序排列。列：每列表示一种特征。每列的数据类型应保持一致，不同列可以具有不同的数据类型。顺序：表格中的行通常按照特定顺序排列。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
盘古推理SDK简介 - 盘古大模型 PanguLargeModels

盘古推理SDK简介推理SDK概述盘古大模型推理SDK是对REST API进行的封装，通过该SDK可以处理用户的输入，生成模型的回复，从而实现自然流畅的对话体验。表1 推理SDK清单 SDK分类 SDK功能支持语言使用场景推理SDK 对话问答（/chat/completions）

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求模型类别特征要求水平分辨率要求区域范围要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
明确任务需求 - 盘古大模型 PanguLargeModels

明确任务需求需要站在模型的角度理解相关任务的真实底层任务，并清晰描述任务要求。例如，在文档问答任务中，任务本质不是生成，而是抽取任务，需要让模型“从文档中抽取出问题的答案，不能是主观的理解或解释，不能修改原文的任何符号、字词和格式”，如果使用“请阅读上述文档，并生成以下问题

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比文本类数据集流通文本类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”，用于后续模型训练等操作。平台支持发布的数据集格式为默认格式、盘古格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

置为符合要求的段落。扩写：根据段落的其中一句或者一段续写成完整的段落。若您的无监督文档没有任何结构化信息，可以将有监督的问题设置为“以下是一篇文章的某个句子：xxx/某个段落：xxx。请根据以上的句子/段落，扩写成一段不少于xx个字的文本。”，再将回答设置为符合要求的段落。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
准备工作 - 盘古大模型 PanguLargeModels

态。检查开发环境要求，确认本地已具备开发环境。登录“我的凭证 > 访问密钥”页面，依据界面操作指引获取Access Key（AK）和Secret Access Key（SK）。下载的访问密钥为credentials.csv文件，包含AK/SK信息。认证用的ak和sk硬编码到

 帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

录和管理数据集的版权信息，确保数据的使用合法合规，并清晰地了解数据集的来源和相关的版权授权。通过填写这些信息，可以追溯数据的来源，明确数据使用的限制和许可，从而保护数据版权并避免版权纠纷。单击页面右下角“立即创建”，回退至“数据导入”页面，在该页面可以查看数据集的任务状态，若状态为“运行成功”，则数据导入成功。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

如何让大模型按指定风格或格式回复 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

盘古推理SDK简介 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

明确任务需求 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线