搜索_华为云

多轮问答场景，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

"target": "是的，我试了还是不行"} 数据质量：若数据格式没有问题，仍然发现模型效果不好，您可以根据具体问题针对性的提升您的数据质量。比如，随着对话轮数的增加，模型出现了遗忘，可以检查构造的训练数据中轮数是否普遍较少，建议根据实际情况增加数据中的对话轮数。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

若任务较复杂，那么可能就需要更多的训练轮数。数据量级：如果微调数据很多，从客观上来说越多的数据越能接近真实分布，那么可以使用较大的学习率和较大的批量大小，以提高训练效率。如果微调数据量相对较少，则可以使用较小的学习率和较小的数据批量大小，避免过拟合。通用模型的规格：如果模型

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
配置盘古访问授权 - 盘古大模型 PanguLargeModels

配置盘古访问授权盘古大模型服务使用对象存储服务（Object Storage Service，简称OBS）进行数据存储，实现安全、高可靠和低成本的存储需求。因此，为了能够正常的存储数据、训练模型，需要用户配置盘古访问OBS的权限。使用主账号登录盘古大模型套件平台。在左侧菜单选择“平台管理

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
创建模型评估任务 - 盘古大模型 PanguLargeModels

图1 模型评估列表页面填写评估任务所需的评估配置、评估数据和基本信息。图2 创建评估任务评估配置：待评估模型：支持选择多个模型版本同时评估，最多选择5个。待评估模型必须符合前提条件。评估资源：依据选择的模型数据自动给出所需的评估资源。打分模式：当前版本打分模式仅支持

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 评估盘古大模型
常见问题 - 盘古大模型 PanguLargeModels

json解析报错服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。 sdk json数据解析问题。建议排查服务端返回的数据是否和服务SDK设计的结构、字段一致。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
撰写提示词 - 盘古大模型 PanguLargeModels

的设置会影响模型的生成质量和多样性，因此需要根据不同的场景进行选择。提示词的撰写步骤如下：登录盘古大模型套件平台。在左侧导航栏中选择“应用开发 > 提示词工程”，进入提示词工程页面。在工程任务列表页面，找到所需要操作的工程任务，单击该工程任务操作栏中的“撰写”。图1 提示词工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 撰写提示词
模型支持的区域 - 盘古大模型 PanguLargeModels

模型支持的区域区域是一个地理区域的概念。我国地域面积广大，由于带宽的原因，无法仅依靠一个数据中心为全国客户提供服务。因此，根据地理区域的不同将全国划分成不同的支持区域。盘古大模型当前仅支持西南-贵阳一区域。图1 盘古大模型服务区域父主题：模型能力与规格

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略什么情况下需要微调什么情况下不建议微调数据量很少，可以微调吗数据量足够，但质量较差，可以微调吗无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习如何调整训练参数，使模型效果最优如何判断训练状态是否正常如何评估微调后的模型是否正常如何调整推理参数，使模型效果最优

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
概述 - 盘古大模型 PanguLargeModels

概述盘古大模型整合华为云强大的计算和数据资源，将先进的AI算法集成在预训练大模型中，打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。华为云盘古大模型，以下功能支持API调用。表1 API清单 API 功能 NLP-文本补全给定一个

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
Token计算器 - 盘古大模型 PanguLargeModels

为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。 URI POST /v1/{project_id}/deployments/{deployment_id}/caltokens

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API
为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
与其他云服务的关系 - 盘古大模型 PanguLargeModels

与其他云服务的关系与对象存储服务的关系盘古大模型使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

默认值范围说明数据批量大小 8 >=1 数据集进行分批读取训练，设定每个批次数据的大小。一般来说，批大小越大，训练速度越快，但会占用更多的内存资源，且可能导致收敛困难或过拟合。批大小越小，训练速度越慢，但会减少内存消耗，且可能提高泛化能力。因此，批大小需要根据数据集的规模和特点

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
什么情况下需要微调 - 盘古大模型 PanguLargeModels

目标任务依赖垂域背景知识：通用模型学习到的知识大部分都是来自互联网上的开源数据，如果目标任务本身属于某个领域（如金融、政务、法律、医疗、工业等），需要依赖很深的领域背景知识，那么通用模型可能无法满足这些要求，需要在该领域的数据集上进行微调，以增强模型的泛化能力。回答的风格或格式有特殊要求

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
如何判断训练状态是否正常 - 盘古大模型 PanguLargeModels

异常的Loss曲线：平缓且保持高位 Loss曲线异常抖动：Loss曲线异常抖动的原因可能是由于训练数据质量差，比如数据存在噪声或者分布不均衡，导致训练过程不稳定。你可以尝试提升数据质量的方式来解决。图5 异常的Loss曲线：异常抖动父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
基本概念 - 盘古大模型 PanguLargeModels

它从未标记的数据中提取监督信号，属于无监督学习的一个子集。该方法通过创建“预设任务”让模型从数据中学习，从而生成有用的表示，可用于后续任务。它无需额外的人工标签数据，因为监督信号直接从数据本身派生。有监督学习有监督学习是机器学习任务的一种。它从有标记的训练数据中推导出预测函

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
查看评估任务详情 - 盘古大模型 PanguLargeModels

如果指标低是由于提示词（prompt）设置不合理，可以通过在模型训练阶段扩大训练集和验证集来优化模型，从而改善评估结果。另外，还可以将评估数据集设计得更接近训练集的数据，以提升评估结果的准确性。父主题：评估盘古大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 评估盘古大模型
如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。人工评测：您可以采用人工评测的方式，参照目标任务构造评测集，通

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略

总条数： 154

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

多轮问答场景，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

配置盘古访问授权 - 盘古大模型 PanguLargeModels

创建模型评估任务 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

撰写提示词 - 盘古大模型 PanguLargeModels

模型支持的区域 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

Token计算器 - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

与其他云服务的关系 - 盘古大模型 PanguLargeModels

创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

什么情况下需要微调 - 盘古大模型 PanguLargeModels

如何判断训练状态是否正常 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

查看评估任务详情 - 盘古大模型 PanguLargeModels

如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线