搜索_华为云

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

具体格式示例如下： {"context": "你好，请介绍自己", "target": "我是盘古大模型"} csv格式：csv文件的第一列对应context，第二列对应target，具体格式示例如下： "你好，请介绍自己","我是盘古大模型" 单个文件大小不超过50GB，文件数量最多1000个。。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

PASCAL VOC格式说明字段是否必选说明 folder 是表示图像所在的目录名称。 filename 是被标注文件的文件名。 size 是表示图像的像素信息。 width：必选字段，图像的宽度。 height：必选字段，图像的高度。 depth：必选字段，图像的通道数。 segmented

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

回归分类数据：回归分类数据包含多种预测因子（特征），用于预测连续变量的值，与时序数据不同，回归分类数据不要求数据具有时间顺序。具体格式要求详见表1。表1 预测类数据集格式要求文件内容文件格式文件样例时序 csv 数据为结构化数据，包含列和行，每一行表示一条数据，每一列表示一个特征，并且必须包含预测目标列，预测目标列要求为连续型数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据格式：多轮问答场景需要按照指定的数据格式来构造，问题需要拼接上历史所有轮对话的问题和回答。比如，当前是第三轮对话，数据中的问题字段需要包含第一轮的问题、第一轮的回答、第二轮的问题、第二轮的回答以及第三轮的问题，答案字段则为第三轮的回答。以下给出了几条多轮问答的数据样例供您参考：原始对话示例： A：你是谁？ B：您好，我是盘古大模型。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
合成文本类数据集 - 盘古大模型 PanguLargeModels

生成问答对。图1 预训练文本类数据集合成指令参数配置示例其中，各参数介绍如下：变量取值：输入参数的各个变量取值。取值可以是数据集中的字段变量，也可以自定义变量值。保存至任务输出参数（可选）：该参数为输出的结果。由于输出结果为问答对形式，因此生成的问题必须选择context参数，回答必须选择target参数。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

证不过于随机的基础上，增大“温度”或“核采样”的值（二者选其一调整）。若发现生成的文本过于发散，可以降低“话题重复度控制”的值，保证内容统一；反之若发现内容过于单一，甚至出现了复读机式的重复内容生成，则需要增加“话题重复度控制”的值。知识问答：对于文本生成场景（开放问答、基于搜

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

AND关系","value":"值内容","relation_operator":"字段与值的逻辑关系，枚举值","orders":"排序列表","order":"升序还是降序，枚举值：DESC, ASC","limit":"返回数量"] 参数字段解释示例： [['id', 'int'

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
常见问题 - 盘古大模型 PanguLargeModels

ALLOW_LEADING_DECIMAL_POINT_FOR_NUMBERS 这个字段是jackson-core里面用来标识解析json格式数据是否支持前导小数点的字段，这个报错的意思是找不到这个字段，很可能是因为用户使用的jackson版本太老导致。建议客户本地将jackson版本升级到和华为云java

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

Face团队推出的一种大模型请求格式。接口的响应体需要按照jsonpath语法要求进行填写，jsonpath语法的作用是从响应体的json字段中提取出所需的数据。评测配置评测类型选择“自动评测”。评测规则选择“基于规则”。评测数据集评测模板：使用预置的专业数据集进行评测。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
明确任务需求 - 盘古大模型 PanguLargeModels

外部知识。例如，在构造泛化问题的任务中，需要基于原问题改写为相同含义的问题，而不是生成相似的问题。当提示词使用“请生成10个跟“手机银行怎么转账”相似的问题”时，模型会认为实体/关键词/场景一致则是相似（在这个例子里实体为手机银行），而不是任务需要的语义级别的相同含义，所以输出内容会发散。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
文本对话 - 盘古大模型 PanguLargeModels

oken时会受到一定的惩罚。当frequency_penalty的值为正数时，模型会更倾向于生成出现频率较低的Token，即模型会更倾向于使用不常见的词汇。最小值：-2，最大值：2 最小值：-2 最大值：2 缺省值：0 （表示该参数未生效） moderation_config 否

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

景各需要准备至少5000条数据。数据质量要求：保证微调数据中的输入（context字段）不重复，否则会造成模型效果不佳。保证微调数据内容干净，不包含异常字符。保证输出（target字段）内容符合业务场景需求。例如，短视频口播场景要求文风可以引起观众兴趣、不丢失产品特点且可以引导观众购买。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

"列名2"]，默认设置为[]，表示所有特征都用于训练。标准化列指定需要进行最大最小值标准化处理的数值特征的列表。格式为["列名1","列名2"]，默认设置为[]，表示没有特征需要标准化。标准化将特征值缩放到0到1的范围，处理分布差异较大的数值特征。预测目标列指定预测目标变量的列

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
构造请求 - 盘古大模型 PanguLargeModels

}/deployments/{deployment_id}/chat/completions 请求消息头附加请求头字段，如指定的URI和HTTP方法所要求的字段。例如，定义消息体类型的请求头“Content-Type”，请求鉴权信息等。以下公共消息头需要添加到请求中。 Con

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
应用 - 盘古大模型 PanguLargeModels

ID设置为任意值，使用标准UUID格式。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent开发
查看预测大模型训练状态与指标 - 盘古大模型 PanguLargeModels

均方根误差是预测值与真实值之间差异的平方和的均值的平方根。它用于衡量模型预测值与实际值之间的偏差，数值越小，表明模型预测的精度越高。平均绝对误差平均绝对误差是预测值与真实值之间绝对误差的均值。它同样用于衡量模型预测值与实际值之间的差异，数值越小，表明模型预测的准确性越高。真实值和预测值

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

NLP大模型训练损失值训练损失值是一种衡量模型预测结果和真实结果之间的差距的指标，通常情况下越小越好。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。验证损失值模型在验证集上的损失值。值越小，意味着模型对验证集数据的泛化能力越好。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
工作流 - 盘古大模型 PanguLargeModels

ID设置为任意值，使用标准UUID格式。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent开发
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

数据格式样例：JSONL格式，每行是一条JSON，包含“context”和“target”两个字段。示例如下： query改写模块：准备对应省略补全任务的数据和对应指代消解任务的数据。 {"context": ["你对李健怎么看 | 音乐诗人李健。请根据以上背景补全以下问题：喜欢么"], "target":

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

工作流常见报错及解决方案请详见表1。表1 工作流节点常见报错与解决方案模块名称错误码错误描述解决方案开始节点 101501 开始节点全局配置未传入值。开始节点错误，请联系客服解决。结束节点 101531 结束节点初始化失败。检查结束节点配置，可能为校验报错。 101532 结束节点模板拼接失败。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用

总条数： 43

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

合成文本类数据集 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

明确任务需求 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

应用 - 盘古大模型 PanguLargeModels

查看预测大模型训练状态与指标 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

工作流 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线