搜索_华为云

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求平台支持创建预测类数据集，创建时可导入时序数据、回归分类数据。时序数据：时序预测数据是一种按时间顺序排列的数据序列，每个数据点都有一个时间戳，表示数据在时间上的位置。它用于预测未来事件或趋势，过去的数据会影响未来的预测。回归分类数据：回归分类数据包含多种预

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案例库和FAQ库等，可以使用“先搜后推”的解决方案。客户的文档库可以

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
查看提示词评估结果 - 盘古大模型 PanguLargeModels

查看提示词评估结果评估任务创建完成后，会跳转至“评估”页面，在该页面可以查看评估状态。图1 查看提示词评任务状态单击“评估名称”，进入评估任务详情页，可以查看详细的评估进度，例如在图2中有10条评估用例，当前已评估8条，剩余2条待评估。图2 查看评估进展评估完成后，可以查看每条数据的评估结果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
创建盘古图片类数据集标注任务 - 盘古大模型 PanguLargeModels

标注作业”页面，单击标注任务操作列的“标注”按钮，进入“标注”页面。在“标注”页面的右下角展示了AI预标注的结果，可参考其内容进行标注。图3 标注页面一条数据标注完成后，单击“提交”按钮可继续标注剩余数据，直至所有数据标注完成。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

生成的内容结尾必须要引导观众购买； 6.生成的内容必须紧扣产品本身，突出产品的特点，不能出现不相关的内容； 7.生成的内容必须完整，必须涵盖产品介绍中的每个关键点，不能丢失任何有价值的细节； 8.生成的内容必须符合客观事实，不能存在事实性错误； 9.生成的内容必须语言通顺； 10.生成的内容中不能出现“带货口播”等这一类字样；

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
管理盘古数据资产 - 盘古大模型 PanguLargeModels

了一系列管理功能，包括查看数据集的详细信息、追踪操作记录、以及数据集的删除管理等。这不仅便于用户对已发布数据集的集中管理，还可帮助用户了解每个数据集的使用情况，从而简化数据资产的维护更新流程。通过这样的统一管理，用户能够更高效地组织和利用数据资源，确保数据资产的安全性和一致性。管理数据资产

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
创建文本类数据集标注任务 - 盘古大模型 PanguLargeModels

以标注单轮问答数据为例，需要逐一确认问题（Q）及答案（A）是否正确，如果问题或答案不正确，可以对其进行二次编辑，如图7。图7 文本类数据集标注示例一条数据标注完成后，单击“提交”可继续标注剩余数据。所有数据标注完成后，页面会出现标注任务成功的提示。父主题：标注文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集 > 标注文本类数据集
创建视频类数据集标注任务 - 盘古大模型 PanguLargeModels

移交标注任务进入标注页面后，逐一对数据进行标注。以标注视频Caption数据为例，需要逐一标注视频的质量，如图7。图7 视频类数据集标注示例一条数据标注完成后，单击“提交”可继续标注剩余数据。所有数据标注完成后，页面会出现标注任务成功的提示。如果在创建标注任务时设置了使用AI大模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集 > 标注视频类数据集
构造请求 - 盘古大模型 PanguLargeModels

ontent-Type对应，传递除请求消息头之外的内容。若请求消息体中参数支持中文，则中文字符必须为UTF-8编码。每个接口的请求消息体内容不同，也并不是每个接口都需要有请求消息体（或者说消息体为空），GET、DELETE操作类型的接口就不需要消息体，消息体具体内容需要根据具体接口而定。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
创建图片类数据集标注任务 - 盘古大模型 PanguLargeModels

以标注图片Caption数据为例，逐一标注图片的Caption描述，如图7，右下角展示了AI预标注的Caption。图7 图片类数据集标注示例一条数据标注完成后，单击“提交”可继续标注剩余数据。所有数据标注完成后，页面会出现标注任务成功的提示。如果在创建标注任务时设置了使用AI大模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集 > 标注图片类数据集
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

功能模型）采用self-instruct等方式泛化出更多的业务场景数据。示例如下：大模型输入：请改写命令案例，生成10个相似命令，保证每个命令都可以调用正确的指标接口。请注意： 1. 命令必须契合人类常见的提问方式，命令方式必须保证多样化 2. 生成的命令只能改写命令案例中文表达部分的内容

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

1Java简介日期时间格式转换日期有数字+中文、全数字、全中文等形式，将不同种类的日期格式对齐到同种格式。数据过滤异常字符过滤查找数据集每一条数据中携带的异常字符，并将异常字符替换为空值，数据条目不变。不可见字符，比如U+0000-U+001F。表情符六。网页标签符号<p>。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
文本对话 - 盘古大模型 PanguLargeModels

"亲爱的小朋友们，你们好呀！今天我们要来聊一聊一条非常特别的大河——长江。长江是我们中国的一条非常长的河流，它从青藏高原出发，一直流到了上海，最后流入大海哦。长江好长好长，它是我们中国第一大河，也是世界上第三长的河流呢！长江不仅仅是一条河流，它还是很多鱼类的家园。在长江里，有一种鱼

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

t文件、离线excel表格、离线PDF文件、扫描版word文档、扫描版PDF文件等。微调数据要求：数据格式样例：JSONL格式，每行是一条JSON，包含“context”和“target”两个字段。示例如下： query改写模块：准备对应省略补全任务的数据和对应指代消解任务的数据。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
空间管理 - 盘古大模型 PanguLargeModels

Studio大模型开发平台为用户提供了灵活且高效的空间资产管理方式。平台支持用户根据不同的使用场景、项目类别或团队需求，自定义创建多个工作空间。每个工作空间都是完全独立的，确保了工作空间内的资产不受其他空间的影响，从而保障数据和资源的隔离性与安全性。用户可以根据需求灵活划分工作空间，实

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

batch_size：每个训练步骤中使用的样本数据量。 sequence：每个数据样本中的Token数量。数据量以Token为单位。流水线并行微批次大小在流水线并行处理中，通过合理设置并行程度，可以减少各阶段之间的空闲等待时间，从而提升整个流水线的效率。每个数据并行下的批处理大小

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
创建工作流 - 盘古大模型 PanguLargeModels

始组件进行承载，是每个工作流的入口组件。不支持新增或者删除开始组件。单击画布中的开始组件，打开参数配置页面。开始组件的参数默认已配置，不支持修改开始组件的参数配置。图3 开始组件配置图配置结束组件结束组件是工作流给出输出的组件，其标识着工作流的结束。每个工作流执行完成后，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理工作流
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi 支持mp4、avi视频格式上传，所有视频可以放在多个文件夹下，每个文件夹下可以同时包含mp4或avi格式的视频。数据集最大1000万个文件，单文件最大100GB，整个数据集最大100TB。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 NLP大模型支持接入的数据集类型盘古NLP大模型仅支持接入文本类数据集，该数据集格式要求请参见文本类数据集格式要求。构建NLP大模型所需数据量使用数据工程构建盘古NLP大模型数据集进行模型训练时，所需数据量见表1。表1 构建NLP大模型所需数据量

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
创建盘古NLP大模型SFT任务 - 盘古大模型 PanguLargeModels

据集的标注页面。在标注页面后，需要逐一确认问题（Q）及答案（A）是否正确，如果问题或答案不正确，可以对其进行二次编辑。图9 标注页面一条数据标注完成后，单击“提交”按钮可继续标注剩余数据。所有数据标注完成后，页面会出现标注任务成功的提示。图10 标注任务完成提示创建数据

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门

总条数： 45

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

查看提示词评估结果 - 盘古大模型 PanguLargeModels

创建盘古图片类数据集标注任务 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

创建文本类数据集标注任务 - 盘古大模型 PanguLargeModels

创建视频类数据集标注任务 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

创建图片类数据集标注任务 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

空间管理 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

创建工作流 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

创建盘古NLP大模型SFT任务 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线