搜索_华为云

CoT思维链 - 盘古大模型 PanguLargeModels

更高的结果。单样本/多样本可以在提示词中提供示例，让模型先学习后回答，在使用这种方法时需要约束新样例不能照抄前面给的参考样例，新样例必须多样化、不能重复等，否则可能会直接嫁接前文样例的内容，也可以约束只是让它学习参考样例的xxx生成思路、xxx风格、xxx生成方法等。零样本

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建有监督训练任务 - 盘古大模型 PanguLargeModels

批大小还与学习率相关。学习率是指每次更新参数时，沿着梯度方向移动的步长。一般来说，批大小和学习率成正比。如果批大小增大，学习率也相应增大；如果批大小减小，那么学习率也应减小。训练轮数 1 1~50 完成全部训练数据集训练的次数。学习率 0.0001 0~1 学习率用于控制每

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

批大小还与学习率相关。学习率是指每次更新参数时，沿着梯度方向移动的步长。一般来说，批大小和学习率成正比。如果批大小增大，学习率也相应增大；如果批大小减小，那么学习率也应减小。训练轮数 1 1~50 完成全部训练数据集训练的次数。学习率 0.0001 0~1 学习率用于控制每

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
购买盘古大模型套件 - 盘古大模型 PanguLargeModels

盘古大模型套件在订购时分为模型资产和模型推理资产。模型资产即盘古系列大模型，用户可以订购盘古基模型、功能模型、专业大模型。基模型：基模型经过大规模数据的预训练，能够学习并理解多种复杂特征和模式。这些模型可作为各种任务的基础，包括但不限于阅读理解、文本生成和情感分析等，但不具备对话问答能力。功能模型：功能

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
什么情况下需要微调 - 盘古大模型 PanguLargeModels

pt工程，通用模型也能给出比较满意的回答。但如果您的场景涉及以下几种情况，则建议采用微调的手段来解决：目标任务依赖垂域背景知识：通用模型学习到的知识大部分都是来自互联网上的开源数据，如果目标任务本身属于某个领域（如金融、政务、法律、医疗、工业等），需要依赖很深的领域背景知识，那

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量很少，可以微调吗 - 盘古大模型 PanguLargeModels

如果您准备用于微调的数据量很少，无法满足最小的量级要求，那么不建议您直接使用该数据进行微调，否则可能会存在如下问题：过拟合：当微调数据量很小时，为了能充分学习这些数据的知识，可能会训练较多的轮次，因而模型会过分记住这些数据，导致无法泛化到其他数据上，最终发生过拟合现象。欠拟合：当微调数据量很小

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
选择模型与训练方法 - 盘古大模型 PanguLargeModels

务，并具备逻辑推理、代码生成以及插件调用等高阶能力。 NLP大模型提供了基模型和功能模型两种类型：基模型：已经在大量数据上进行了预训练，学习并理解了各种复杂特征和模式。这些模型可以作为其他任务的基础，例如阅读理解、文本生成和情感分析等。基模型本身不具备对话问答能力。功能模型：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

对于微调而言，数据质量非常重要。一份数据量少但质量高的数据，对于模型效果的提升要远大于一份数据量多但质量低的数据。若微调数据的质量较差，那么可能会导致模型学习到一些错误或者不完整的信息，从而影响模型的准确性和可靠性。因此，不建议您直接使用低质量数据进行微调。一份高质量的数据应具备以下几类特征：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
返回结果 - 盘古大模型 PanguLargeModels

繁华的城市，人们穿着古代的服饰，用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言，适应新的生活方式。他开始学习宋朝的礼仪，尝试理解这个时代的文化。在宋朝，李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩，她聪明伶俐，让

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

问答模型的微调核心参数设置训练参数设置值数据批量大小（batch_size） 4 训练轮数（epoch） 3 学习率（learning_rate） 3e-6 学习率衰减比率（learning_rate_decay_ratio） 0.01 热身比例（warmup） 0.1 评估和优化模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

训练和推理过程中，通过数据脱敏、隐私计算等技术手段识别并保护敏感数据，有效防止隐私泄露，保障个人隐私数据安全。内容安全：通过预训练和强化学习价值观提示（prompt），构建正向的意识形态。通过内容审核模块过滤违法及违背社会道德的有害信息。模型安全：通过模型动态混淆技术，使模型

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

什么情况下不建议微调数据量很少，可以微调吗数据量足够，但质量较差，可以微调吗无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习如何调整训练参数，使模型效果最优如何判断训练状态是否正常如何评估微调后的模型是否正常如何调整推理参数，使模型效果最优为什么微调后的模型，回答总是在重复某一句或某几句话

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
盘古大模型套件使用流程 - 盘古大模型 PanguLargeModels

创建一个训练数据集模型训练自监督训练使用不含有标记的数据进行模型训练。创建自监督微调训练任务有监督训练使用含有标记的数据进行模型训练，以学习输入和输出之间的映射关系。创建有监督训练任务模型评估创建模型评估任务训练完成后评估模型的回答效果。创建模型评估任务查看模型评估结果

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

表1 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 6 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.013

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

表2 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 4 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.01

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型

总条数： 41

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CoT思维链 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

购买盘古大模型套件 - 盘古大模型 PanguLargeModels

什么情况下需要微调 - 盘古大模型 PanguLargeModels

数据量很少，可以微调吗 - 盘古大模型 PanguLargeModels

选择模型与训练方法 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

盘古大模型套件使用流程 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线