搜索_华为云

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
模型训练所需数据量与数据格式要求 - 盘古大模型 PanguLargeModels

{"context":"非深户在职人员长期在异地居住的是否可以办理异地就医备案手续","target":"可以。本市用人单位长期派驻异地（国内市外）工作的在职参保人员，可以按照常驻异地工作人员申请办理备案。"} 详细有监督数据格式性参见表4。是评测数据 CSV、JSONL 同有监督单轮不带system

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
配置Cache(Python SDK) - 盘古大模型 PanguLargeModels

# 校验，不一致 # 用于检查缓存中的数据是否与查询的数据不一致，如果不一致，返回空值 # 例如，查询“有没有数据？”这个问题和“test-semantic-cache-vector-001”这个会话标识，就无法从缓存中获取到任何答案，因为这个问题和之前保存的问题都不一致 query_not

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python > 配置Memory(Python SDK)
配置Cache(Java SDK) - 盘古大模型 PanguLargeModels

//校验，不一致 //用于检查缓存中的数据是否与查询的数据不一致，如果不一致，返回空值 //例如，查询“有没有数据？”这个问题和“test-semantic-cache-vector-001”这个会话标识，就无法从缓存中获取到任何答案，因为这个问题和之前保存的问题都不一致 String

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Memory(Java SDK)
安装SDK(Python SDK) - 盘古大模型 PanguLargeModels

安装SDK(Python SDK) pip直接安装执行如下命令： pip install pangu_kits_app_dev_py 本地导入从support网站上下载pangu-kits-app-dev-py的whl包。建议使用conda创建一个新的python环境，python版本选择3.9。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python
为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同当您将微调的模型部署以后，输入一个已经出现在训练样本中，或虽未出现但和训练样本差异很小的问题，回答完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

一份高质量的数据应具备以下几类特征：数据与目标任务一致：微调数据应该与微调任务的目标和分布保持一致，反映出任务的实际要求。比如，现在需要微调一个情感分类的模型，模型只需要回复“消极”或者“积极”：情感分类场景-典型低质量数据：数据中存在与目标任务不一致的样本。 {"context":

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
获取API认证鉴权信息（获取Token） - 盘古大模型 PanguLargeModels

name、project id。 project id参数需要与盘古服务部署区域一致。例如，盘古大模型部署在“西南-贵阳一”区域，需要获取与“西南-贵阳一”区域对应的project id。图1 查看盘古服务区域图2 获取user name、domain name、project

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
常见问题 - 盘古大模型 PanguLargeModels

服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。 sdk json数据解析问题。建议排查服务端返回的数据是否和服务SDK设计的结构、字段一致。 SDK运行报错 java

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
部署边缘模型 - 盘古大模型 PanguLargeModels

边缘部署”，单击右上角“部署”按钮。在创建部署页面选择模型与部署资产，选择部署方式为边缘部署，输入推理实例数（根据边缘资源池的实际资源选择），输入服务名称，单击“立即创建”。创建成功后，可在“模型部署 > 边缘部署”，查看边缘部署列表。单击“服务名称”可进入服务详情界面。如果服务部署状态为

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
Agent效果优化 - 盘古大模型 PanguLargeModels

优化System prompt 提示财务报销助手依赖的必要信息，如用户名称等基础信息： final String customSystemPrompt = "你是财务报销助手。当需要用户反馈信息时，尽可能提示用户名称等原始信息。今天的日期是" + new SimpleDateFormat("yyyy年MM月dd日")

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Agent(Java SDK)
获取项目ID - 盘古大模型 PanguLargeModels

名和IAM用户ID。在调用盘古API时，获取的项目id需要与盘古服务部署区域一致，例如盘古大模型当前部署在“西南-贵阳一”区域，需要获取与贵阳一区域的对应的项目id。图2 获取项目ID 多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。调用API获取项目ID 项目

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
创建有监督训练任务 - 盘古大模型 PanguLargeModels

模型训练列表在训练配置中，选择模型类型、训练类型、训练方式、训练模型与训练参数。其中，训练配置选择LLM（大语言模型），训练类型选择有监督训练，根据所选模型配置训练参数。表1 有监督微调参数说明参数名称说明模型类型选择“LLM”。训练类型选择“有监督微调”。训练方式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
部署为在线服务 - 盘古大模型 PanguLargeModels

选择盘古-NLP-N4系列模型时显示，配置最大Token长度。服务名称在线服务的名称。描述在线服务的简要描述。订阅提醒勾选订阅提醒，并添加手机号/邮箱，系统将在训练任务完成或重要事件发生时，发送提醒。表2 部署实例量与推理单元数关系模型类型推理资源盘古-NLP-N1系列模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型
查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

公式为候选句中出现于标准译文中的单词数（m）与候选句总单词数（n）的比值，即m/n。指标看板通过BLEU-1、BLEU-2与BLEU-4评价模型性能。 BLEU-1：机器翻译、⽂本摘要等生成类任务常用的评价指标。用于评估模型生成句子与实际句子在单字层面的匹配度，数值越高，表明模型性能越好。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
检测数据集质量 - 盘古大模型 PanguLargeModels

数据集创建成功后，平台将对数据集中的数据进行质量校验，并给出健康度评分、合规度评分与数据长度分布。检测数据集质量在“数据工程 > 数据管理”页面，选择“我的数据集”或者“训练数据集”页签。单击数据集名称，进入数据集详情页，查看详细的数据质量。其中，数据长度按照token长度划分

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

据文件用于创建对应的评估数据集。提示词变量是一种可以在文本生成中动态替换的占位符，用于根据不同的场景或用户输入生成不同的内容。其中，变量名称可以是任意的文字，用于描述变量的含义或作用。提示词评估数据集约束限制上传文件限xlsx格式。数据行数不小于10行，不大于50行。数据不允许相同表头，表头数量小于20个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 批量评估提示词效果
创建一个新的数据集 - 盘古大模型 PanguLargeModels

创建数据集时，可以指定数据文件或者数据文件所在的文件夹。评测数据集创建数据集时，可以指定数据文件或者数据文件所在的文件夹。基本信息填写数据集名称与描述，选择行业、语言和数据标签。图9 填写基本信息参数填选完成后，单击“立即创建”。创建好的数据集将显示在数据集列表中。父主题：准备盘古大模型训练数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
创建AI助手 - 盘古大模型 PanguLargeModels

> AI助手”，单击页面右上角“创建助手”。参考表1完成AI助手匹配。表1 创建AI助手参数说明参数分类参数名称参数说明基本信息助手名称设置AI助手的名称。描述填写AI助手的描述，如填写功能介绍。指令通过指令可以设定A助手的行为和响应。如设置AI助手可以扮演的

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手

总条数： 60

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

模型训练所需数据量与数据格式要求 - 盘古大模型 PanguLargeModels

配置Cache(Python SDK) - 盘古大模型 PanguLargeModels

配置Cache(Java SDK) - 盘古大模型 PanguLargeModels

安装SDK(Python SDK) - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

获取API认证鉴权信息（获取Token） - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

部署边缘模型 - 盘古大模型 PanguLargeModels

Agent效果优化 - 盘古大模型 PanguLargeModels

获取项目ID - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

部署为在线服务 - 盘古大模型 PanguLargeModels

查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

检测数据集质量 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

创建一个新的数据集 - 盘古大模型 PanguLargeModels

创建AI助手 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线