搜索_华为云

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同当您将微调的模型部署以后，输入一个已经出现在训练样本中，或虽未出现但和训练样本差异很小的问题，回答完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
搭建边缘服务器集群 - 盘古大模型 PanguLargeModels

单击“添加”，选择要添加的主控节点，单击“确定”。在“工作节点”处单击“添加”，选择要添加的工作节点，单击“确定”。单击“立即创建”，可在资源池列表中查看节点的状态。如果状态为“运行中”，则创建成功。在主控节点执行如下k8s命令，验证边缘池创建结果：执行如下命令建立软连接。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
产品优势 - 盘古大模型 PanguLargeModels

产品优势海量训练数据盘古大模型依托海量且多样化的训练数据，涵盖从日常对话到专业领域的广泛内容，帮助模型更好地理解和生成自然语言文本，适用于多个领域的业务应用。这些数据不仅丰富多样，还为模型提供了深度和广度的语言学习基础，使其能够生成更加自然、准确且符合语境的文本。通过对海量数据

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
LLMs（语言模型） - 盘古大模型 PanguLargeModels

url为自定义的url地址（名字由开发者任意指定，或直接传入url地址），可以指向不同的模型，因此llm1为一个大模型；而llm2没有指定config，默认使用sdk.llm.pangu.url，若地址与custom.llm.url，则为另外一个大模型。自定义参数问答：自定义设置如temperature等参数，获得对应的效果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
部署为在线服务 - 盘古大模型 PanguLargeModels

4K版本：当部署一个实例时，占用0.125个推理单元。 32K版本：当部署一个实例时，占用0.125个推理单元。 128K版本：当部署一个实例时，占用1个推理单元。盘古-NLP-N2系列模型当部署一个实例时，占用0.5个推理单元。盘古-NLP-N4系列模型当部署一个实例时，占用1个推理单元。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型
Prompt（提示词模板） - 盘古大模型 PanguLargeModels

构造Prompt模板 interface Antonyms { String FIND_ANTONYMS = "给定一个单词：{{word}}，返回一个反义词：{{antonym}}"; } import java.util.ArrayList; import java.util

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集训练数据集创建流程模型训练所需数据量与数据格式要求创建一个新的数据集检测数据集质量清洗数据集（可选）发布数据集创建一个训练数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
提示工程介绍 - 盘古大模型 PanguLargeModels

单任务中模糊的指示也会取得较好的效果，但对于规则越复杂的任务，越需要应用这些技巧来输出一个逻辑自洽、清晰明了的指令。提示词是什么提示词也称为Prompt，是与大模型进行交互的输入，可以是一个问题、一段文字描述或者任何形式的文本输入。提示词要素指令：要求模型执行的具体任务或

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
设置背景及人设 - 盘古大模型 PanguLargeModels

增加人设可以让生成的内容更符合该领域需求。例如，“假设你是一位银行面试官，请生成10个银行面试问题。”、“假如你是一个高级文案策划，请生成10个理财产品的宣传文案。”、“你是一个财务分析师，请分析上述财务指标的趋势。” 父主题：进阶技巧

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

可以采用PPL（困惑度），或训练一个二分类模型等方式过滤脏数据。数据增强：您可以通过一些规则来提升数据的多样性，比如：同义词替换、语法结构修改、标点符号替换等，保证数据的多样性。基于大模型的数据泛化：您可以通过调用大模型（比如盘古提供的任意一个规格的基础功能模型）来获取目标场

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
错误码 - 盘古大模型 PanguLargeModels

可以通过重试机制解决，在代码里检查返回值，碰到这个并发错误可以延时一小段时间（如2-5s）重试请求；也可以后端检查上一个请求结果，上一个请求返回之后再发送下一个请求，避免请求过于频繁。请与技术支持确认，API是否已完成部署。 APIG.0301 Incorrect IAM authentication

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
返回结果 - 盘古大模型 PanguLargeModels

"text": "故事标题：《穿越宋朝的奇妙之旅》在一个阴雨绵绵的夜晚，一个名叫李晓的年轻人正在阅读一本关于宋朝的历史书籍。突然，他感到一阵眩晕，当他再次睁开眼睛时，他发现自己身处一个完全陌生的地方。李晓发现自己穿越到了宋朝。他身处一座繁华的城市，人们穿着古

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
实例化Tool - 盘古大模型 PanguLargeModels

参的提取，尽量描述清楚，如果Agent实际执行效果不符合预期，可以调整。上例中的args_schema为一个复杂的入参，如果工具的入参为一个基本类型，则不需要再额外定一个结构体，例如： from typing import Type from pangukitsappdev.tool

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Agent（智能代理）
多轮问答场景，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

多轮问答场景的输入（“context”字段）请务必使用“[问题, 回答, 问题, 回答, 问题, ……]”的方式来构造，若您的数据是同一个角色连续多次对话的“多轮问题”，可以将同一个角色的对话采用某个分隔符拼接到一个字符串中。例如：原始对话示例： A：xxx号话务员为您服务！ A：先生您好，有什么可以帮助您的？ B：你好，是这样的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建AI助手 - 盘古大模型 PanguLargeModels

工具配置网页搜索开启网页搜索后，可以通过调用web搜索来解决模型对于事实类问题回答不好的现象。添加一个工具用于拓展AI助手功能，使其能够与外部系统进行交互。可以直接创建一个工具，或者从搜索框中选择已经创建好的工具。知识库通过知识库提升AI助手在特定领域问题的回答效果。高级配置

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手
实例化Tool - 盘古大模型 PanguLargeModels

注意：字段的命名需要以小写字母开头，否则在转换成标准的Json schema时会出现问题，导致模型精度受到影响。上例中的InputParam为一个复杂的入参，如果工具的入参为基本类型，则不需要再额外定一个结构体，例如： import com.huaweicloud.pangu.dev.sdk.api.annotation

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Agent（智能代理）
认证鉴权 - 盘古大模型 PanguLargeModels

份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。如果您的华为云账号已升级为华为账号，将不支持获取账号Token。建议为您自己创建一个IAM用户，获取IAM用户的Token。获取Token方法： Toke

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
考察模型逻辑 - 盘古大模型 PanguLargeModels

xx问题，请给我具体的xxx问题，以便我更好地解答。” 复述任务要求可以让模型复述prompt中的要求，考察模型是否理解。比如“现在有一个xxx任务，我会给你xxx，你需要xxxx。\n\n现在你充分理解这个任务了吗？详细解释一遍，不用举例子/请举例说明。” 父主题：进阶技巧

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。人工评测：您可以采用人工评测的方式，参照目标任务构造评测集，通过横向或纵向评估评测集的方式来验证模型效果。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
模型的基础信息 - 盘古大模型 PanguLargeModels

4096 基于NLP-N2-基模型训练的单场景模型，可支持选择一个场景进行推理，如：搜索RAG方案等，具有4K上下文能力。盘古-NLP-N2单场景模型-32K 32768 基于NLP-N2-基模型训练的单场景模型，可支持选择一个场景进行推理，如：搜索RAG方案等，具有32K上下文能力。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格

总条数： 111

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

搭建边缘服务器集群 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

LLMs（语言模型） - 盘古大模型 PanguLargeModels

部署为在线服务 - 盘古大模型 PanguLargeModels

Prompt（提示词模板） - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

提示工程介绍 - 盘古大模型 PanguLargeModels

设置背景及人设 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

错误码 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

实例化Tool - 盘古大模型 PanguLargeModels

多轮问答场景，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

创建AI助手 - 盘古大模型 PanguLargeModels

实例化Tool - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

考察模型逻辑 - 盘古大模型 PanguLargeModels

如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

模型的基础信息 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线