搜索_华为云

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

多轮问答场景的输入（“context”字段）请务必使用“[问题, 回答, 问题, 回答, 问题, ……]”的方式来构造，若您的数据是同一个角色连续多次对话的“多轮问题”，可以将同一个角色的对话采用某个分隔符拼接到一个字符串中。例如：原始对话示例： A：xxx号话务员为您服务！ A：先生您好，有什么可以帮助您的？ B：你好，是这样的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
大模型开发基本概念 - 盘古大模型 PanguLargeModels

大模型开发基本概念大模型相关概念概念名说明大模型是什么大模型是大规模预训练模型的简称，也称预训练模型或基础模型。所谓预训练模型，是指在一个原始任务上预先训练出一个初始模型，然后在下游任务中对该模型进行精调，以提高下游任务的准确性。大规模预训练模型则是指模型参数达到千亿、万亿级别的预训练模

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

这里代表高空Loss（深海Loss）和表面Loss（海表Loss）的综合Loss。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。高空Loss（深海Loss）高空Loss（深海Loss）是衡量模型在高空层次变量

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

问答场景中，也称为检索增强问答，如政务问答场景，行业客服智能问答场景等。下面将以一个具体的政务问答助手为例进行说明。该场景通过收集政务问答数据和相关政务问答文档，基于检索增强问答框架，构建了一个智能化的政务问答助手。图1 政务问答智能助手整体框架上图给出了政务问答智能助手的

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
状态码 - 盘古大模型 PanguLargeModels

未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。 414

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

在特定任务上具有更高的准确性：微调后的模型在具体任务中表现更优。相较于预训练阶段的通用能力，微调能使模型更好地解决细分任务的需求。在一个客户服务问答系统中，可以用特定领域（如电商、保险）的对话数据对预训练模型进行微调，使其更好地理解和回答与该领域相关的问题。此外，针对微调训练任务，平台提供了两种微调方式：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
考察模型逻辑 - 盘古大模型 PanguLargeModels

xx问题，请给我具体的xxx问题，以便我更好地解答。” 复述任务要求可以让模型复述prompt中的要求，考察模型是否理解。比如“现在有一个xxx任务，我会给你xxx，你需要xxxx。\n\n现在你充分理解这个任务了吗？详细解释一遍，不用举例子/请举例说明。” 父主题：提示词写作进阶技巧

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

提取图文压缩包中的JSON文本和图片，并对图片进行结构化解析（BASE64编码）。数据过滤图文文本长度过滤过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
认证鉴权 - 盘古大模型 PanguLargeModels

份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。如果您的华为云账号已升级为华为账号，将不支持获取账号Token。建议为您自己创建一个IAM用户，获取IAM用户的Token。获取Token方法： Toke

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

“训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。 Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：理论上模型的参数规模越大，模型能学到

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
CoT思维链 - 盘古大模型 PanguLargeModels

杂推理或数学任务，在问题的结尾可以加上“分步骤解决问题”或者“让我们一步一步地思考”，以引导大模型进行逐步的推理和解答。通过上述指令，将一个推理任务拆解分步骤进行，可以降低推理任务的难度并可以增强答案可解释性。另外，相比直接输出答案，分步解决也容许大模型有更多的“思考时间”，用更多的计算资源解决该问题。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

型进行部署。如果使用全球中期降水预测模型，需要选择1个平台预置好的全球中期降水预测模型，并选择对应的全球中期天气要素预测模型。并且至少有一个中期天气要素模型时间分辨率要小于等于降水模型时间分辨率。部署模型在“从资产选模型”选择所需模型。部署方式云上部署：算法部署至平台提供的资源池中。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 部署科学计算大模型
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

_20180919_114745.xml”。物体检测的标注文件需要满足PASCAL VOC格式，PASCAL_VOC是一个公开的图像标注数据集，它提供了一个统一的XML格式来存储标注信息。PASCAL_VOC文件格式包含图像目录、图像文件、图像尺寸、图像中目标信息等元素，详细格式说明请参见表4。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

时也可能会降低模型的拟合能力。取值范围：[0,1]。优化器种类优化器种类优化器是用于更新模型参数的算法，目前支持ADAM优化器。第一个动量矩阵的指数衰减率(beta1) 用于定义ADAM优化器中的一阶矩估计的指数衰减率。一阶矩估计相当于动量，可以加速梯度在相关方向的下降并抑制震荡。取值范围：(0

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建视频类数据集加工任务 - 盘古大模型 PanguLargeModels

图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工任务。若单击“保存”，数据集列表页中将新增一个任务状态为“待处理”的数据加工任务，可单击操作列“执行”启动加工。图6 数据加工图7 执行加工当加工数据集任务运行成功后，状态将从“

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工视频类数据集
创建文本类数据集加工任务 - 盘古大模型 PanguLargeModels

图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工任务。若单击“保存”，数据集列表页中将新增一个任务状态为“待处理”的数据加工任务，可单击操作列“执行”启动加工。图6 数据加工图7 执行加工当加工数据集任务运行成功后，状态将从“

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工文本类数据集
创建气象类数据集加工任务 - 盘古大模型 PanguLargeModels

图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工任务。若单击“保存”，数据集列表页中将新增一个任务状态为“待处理”的数据加工任务，可单击操作列“执行”启动加工。图6 数据加工图7 执行加工当加工数据集任务运行成功后，状态将从“

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工气象类数据集
创建图片类数据集加工任务 - 盘古大模型 PanguLargeModels

图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工任务。若单击“保存”，数据集列表页中将新增一个任务状态为“待处理”的数据加工任务，可单击操作列“执行”启动加工。图6 数据加工图7 执行加工当加工数据集任务运行成功后，状态将从“

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工图片类数据集
文本对话 - 盘古大模型 PanguLargeModels

保对max_tokens进行了合理的设置。 presence_penalty 否 Float 用于调整模型对新Token的处理方式。即如果一个Token已经在之前的文本中出现过，那么模型在生成这个Token时会受到一定的惩罚。当presence_penalty的值为正数时，模型会

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的总利润和市值是多少？ … 来源四：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，再基于大模型（比如盘古提供的任意一个规格的基础功能模型）采用self-instruct等方式泛化出更多的业务场景数据。示例如下：大模型输入：请改写命令案例，生成10个相似

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型

总条数： 77

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

考察模型逻辑 - 盘古大模型 PanguLargeModels

图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

CoT思维链 - 盘古大模型 PanguLargeModels

创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

创建视频类数据集加工任务 - 盘古大模型 PanguLargeModels

创建文本类数据集加工任务 - 盘古大模型 PanguLargeModels

创建气象类数据集加工任务 - 盘古大模型 PanguLargeModels

创建图片类数据集加工任务 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线