搜索_华为云

为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答会异常中断 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答会异常中断当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果不完整，出现了异常截断。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“最大Token限制”参数的设置，适当增加该参数的值，可以增大

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

系统安全：通过网络隔离、身份认证和鉴权、Web安全等技术保护大模型系统安全，增强自身防护能力，以抵御外部安全攻击。父主题：大模型概念类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差当您在微调过程中，发现模型评估的结果很好，一旦将微调的模型部署以后，输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

若您的无监督文档中含标题、关键词、简介等结构化信息，可以将有监督的问题设置为“请根据标题xxx/关键性xxx/简介xxx，生成一段不少于xx个字的文本。”，将回答设置为符合要求的段落。续写：根据段落的首句、首段续写成完整的段落。若您的无监督文档没有任何结构化信息，可以将有监督的问题设置为“以下是一篇文章的第一个

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

模型规格：理论上模型的参数规模越大，模型能学到的知识就越多，能学会的知识就更难，若目标任务本身难度较大，建议您替换参数规模更大的模型。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
基本概念 - 盘古大模型 PanguLargeModels

交互的语言，用于指示模型生成所需的内容。思维链思维链（Chain-of-Thought）是一种模拟人类解决问题的方法，通过一系列自然语言形式的推理过程，从输入问题开始，逐步推导至最终输出结论。 Self-instruct Self-instruct是一种将预训练语言模型与指

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
盘古大模型-功能总览 - 盘古大模型 PanguLargeModels

建到部署的一站式解决方案。该套件具备模型管理、训练、评估、压缩、部署、推理和迁移等功能，支持模型的自动化评估，确保模型的高性能和可靠性。通过高效的推理性能和跨平台迁移工具，模型开发套件能够保障模型在不同环境中的高效应用。支持区域：西南-贵阳一训练盘古大模型评估盘古大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 功能总览
获取提示词模板 - 盘古大模型 PanguLargeModels

获取提示词模板平台提供了多种任务场景的提示词模板，可以帮助用户更好地利用大模型的能力，引导模型生成更准确且更具针对性的输出，从而提高模型在特定任务上的性能。在创建提示词工程前，可以先使用预置的提示词模板，或基于提示词模板进行改造，如果提示词模板满足不了使用需求，可再单独创建。提示词模板可以在平台“应用开发

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程
Tool Retriever - 盘古大模型 PanguLargeModels

如果把所用的工具全部添加至Agent会产生如下问题：占用大量输入token。和问题无关的工具太多，影响模型的判断。通过Tool Retriever可以解决上述问题，其原理是在Agent运行前，先从所有可用的工具中选择与问题最相关的工具，再交给Agent去处理。定义一个Tool

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Agent（智能代理）
Tool Retriever - 盘古大模型 PanguLargeModels

如果把所用的工具全部添加至Agent会产生如下问题：占用大量输入token。和问题无关的工具太多，影响模型的判断。通过Tool Retriever可以解决上述问题，其原理是在Agent运行前，先从所有可用的工具中选择与问题最相关的工具，再交给Agent去处理，示例如下：定义一个Tool

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Agent（智能代理）
意图匹配 - 盘古大模型 PanguLargeModels

意图匹配应用场景说明：智能客服系统中，大模型将客户问题匹配至语义相同的FAQ问题标题，并返回标题内容，系统根据匹配标题调出该FAQ问答对，来解答客户疑问。父主题：写作示例

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 写作示例
创建有监督训练任务 - 盘古大模型 PanguLargeModels

种方法通常会带来最优的模型性能，但需要大量的计算资源和时间，计算开销较高。局部微调（LoRA）：在模型微调过程中，只对特定的层或模块的参数进行更新，而其余参数保持冻结状态。这种方法在很多情况下可以显著减少计算资源和时间消耗，且依旧可以保持较好的模型性能。训练模型选择训练所需

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
盘古大模型-成长地图 - 盘古大模型 PanguLargeModels

如何利用推理SDK高效集成盘古大模型的推理能力，为您的应用提供智能支持，提升模型在实际场景中的推理性能。 SDK文档盘古推理SDK简介使用推理SDK 常见问题了解更多常见问题、案例和解决方案热门案例大模型是什么？大模型的计量单位token指的是什么？大模型是否可以自定义人设？

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
理解底层任务 - 盘古大模型 PanguLargeModels

档中抽取出问题的答案，不能是主观的理解或解释，不能修改原文的任何符号、字词和格式”，如果使用“请阅读上述文档，并生成以下问题答案”，“生成”一词不是很恰当，模型会引入一些外部知识。例如，在构造泛化问题的任务中，需要基于原问题改写为相同含义的问题，而不是生成相似的问题。当提示词

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

即m/n。指标看板通过BLEU-1、BLEU-2与BLEU-4评价模型性能。 BLEU-1：机器翻译、⽂本摘要等生成类任务常用的评价指标。用于评估模型生成句子与实际句子在单字层面的匹配度，数值越高，表明模型性能越好。 BLEU-2：机器翻译、⽂本摘要等生成类任务常用的评价指标。用

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
自定义模型 - 盘古大模型 PanguLargeModels

if (StringUtils.isEmpty(url)) { throw new PanguDevSDKException("the llm.custom.api.url is not config"); }

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > LLMs（语言模型）

总条数： 126

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答会异常中断 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

盘古大模型-功能总览 - 盘古大模型 PanguLargeModels

获取提示词模板 - 盘古大模型 PanguLargeModels

Tool Retriever - 盘古大模型 PanguLargeModels

Tool Retriever - 盘古大模型 PanguLargeModels

意图匹配 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

盘古大模型-成长地图 - 盘古大模型 PanguLargeModels

理解底层任务 - 盘古大模型 PanguLargeModels

查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

自定义模型 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线