搜索_华为云

如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。人

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

数据中无异常样本：微调数据需要清洗和校验，滤除其中的噪声，尽可能保证回答中不存在异常数据。如空数据、重复、水印和异常字符等。数据多样性：微调数据需要具有一定的多样性，多样性能增加任务的复杂度和难度，让模型能够处理不同的情况和问题，提升模型泛化性。例如，现在需要微调一个文案创作的模型，模型需要生成各个城市的宣传文案：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
配置Cache(Java SDK) - 盘古大模型 PanguLargeModels

Default private int expireAfterWrite = -1; /** * 最大个数，默认不设置过期 */ @Builder.Default private int maximumSize = -1; 语义缓存：语义缓存是一种基于向量和相似度的缓存方法

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Memory(Java SDK)
实例化Tool(Java SDK) - 盘古大模型 PanguLargeModels

"会议开始时间，格式为HH:mm") private String start; @AgentToolParam(description = "会议结束时间，格式为HH:mm") private String end; @A

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Agent(Java SDK)
数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

能模型）来获取有监督场景。一个比较常见的方法是，将无监督的文本按照章节、段落、字符数进行切片，让模型基于这个片段生成问答对，再将段落、问题和答案三者组装为有监督数据。使用模型构建的优点是数据丰富度更高，缺点是成本较高。当您将无监督数据构建为有监督数据时，请尽可能保证数据的多样性

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
认证鉴权 - 盘古大模型 PanguLargeModels

AK/SK认证就是使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从而通过身份认证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。 SK(Secret Access Key)：与访问密钥ID结合使用的密钥，对

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
监听Agent(Java SDK) - 盘古大模型 PanguLargeModels

UUID，在一个session内唯一 */ private String sessionId; /** * Agent返回的最终答案（最后一个AgentAction的输出） */ private String finalAnswer = "";

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Agent(Java SDK)
模型Agent助手应用开发(Java SDK) - 盘古大模型 PanguLargeModels

HH:mm") private String start; @AgentToolParam(description = "会议结束时间，格式为yyyy-MM-dd HH:mm") private String end;

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > 盘古应用开发SDK实践
配置LLMs(Java SDK) - 盘古大模型 PanguLargeModels

支持调整的参数解释。 private int maxTokens; // 完成时要生成的令牌的最大数量 private double temperature; // 调整随机抽样的程度，温度值越高，随机性越大 private double topP; // 核采样值，和temperature不同时配置

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java
使用Tool Retriever优化Agent性能(Java SDK) - 盘古大模型 PanguLargeModels

将由用户自定义，将在后续示例中说明。此外，上述例子使用的向量数据库配置指定索引名称，以及使用name和description作为向量化字段，因此工具入库时，会将工具的name和description进行向量化，并在后续的检索中生效。注意，上述toolList中包含的工具在SDK中并不存在，需要替换成实际的工具。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Agent(Java SDK)
添加Agent流式输出(Java SDK) - 盘古大模型 PanguLargeModels

setStreamCallback(StreamAgentCallBack streamAgentCallback); StreamAgentCallBack实现示例： private class StreamAgentCallBackImpl implements StreamAgentCallBack {

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java > 配置Agent(Java SDK)
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

失、浪费和管理不善的情况？在社会建设专项资金的使用情况中，应规范操作，加强管理，及时纠正和化解建设过程中的解释、调取和留置问题，严防管理漏洞，保证应用资金的安全性和真实性。同时，应建立完善的监管机制，严格管理，加强监督，加强专项资金使用情况的评估，加强对建设过程的监管和评估，节约

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
什么是提示词工程 - 盘古大模型 PanguLargeModels

提示工程是一个较新的学科，应用于开发和优化提示词（Prompt），帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握提示词工程相关技能将有助于用户了解大型语言模型的能力和局限性。提示工程不仅涉及设计和研发提示词，还包括与大型语言模型的交互和研发中的各种技能和技术。它在实现和对接大型语言模型、

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程
选择模型与训练方法 - 盘古大模型 PanguLargeModels

NLP大模型 NLP大模型主要用于处理和理解人类语言，能够实现对话问答、文案生成和阅读理解等任务，并具备逻辑推理、代码生成以及插件调用等高阶能力。 NLP大模型提供了基模型和功能模型两种类型：基模型：已经在大量数据上进行了预训练，学习并理解了各种复杂特征和模式。这些模型可以作为其他任务

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
产品优势 - 盘古大模型 PanguLargeModels

广泛内容，帮助模型更好地理解和生成自然语言文本，适用于多个领域的业务应用。这些数据不仅丰富多样，还为模型提供了深度和广度的语言学习基础，使其能够生成更加自然、准确且符合语境的文本。通过对海量数据的深入学习和分析，盘古大模型能够捕捉语言中的细微差别和复杂模式，无论是在词汇使用、语

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍

总条数： 147

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

配置Cache(Java SDK) - 盘古大模型 PanguLargeModels

实例化Tool(Java SDK) - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

监听Agent(Java SDK) - 盘古大模型 PanguLargeModels

模型Agent助手应用开发(Java SDK) - 盘古大模型 PanguLargeModels

配置LLMs(Java SDK) - 盘古大模型 PanguLargeModels

使用Tool Retriever优化Agent性能(Java SDK) - 盘古大模型 PanguLargeModels

添加Agent流式输出(Java SDK) - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

选择模型与训练方法 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线