搜索_华为云

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

训练和推理过程中，通过数据脱敏、隐私计算等技术手段识别并保护敏感数据，有效防止隐私泄露，保障个人隐私数据安全。内容安全：通过预训练和强化学习价值观提示（prompt），构建正向的意识形态。通过内容审核模块过滤违法及违背社会道德的有害信息。模型安全：通过模型动态混淆技术，使模型

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

什么情况下不建议微调数据量很少，可以微调吗数据量足够，但质量较差，可以微调吗无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习如何调整训练参数，使模型效果最优如何判断训练状态是否正常如何评估微调后的模型是否正常如何调整推理参数，使模型效果最优为什么微调后的模型，回答总是在重复某一句或某几句话

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
文本补全 - 盘古大模型 PanguLargeModels

繁华的城市，人们穿着古代的服饰，用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言，适应新的生活方式。他开始学习宋朝的礼仪，尝试理解这个时代的文化。在宋朝，李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩，她聪明伶俐，让

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
盘古大模型套件使用流程 - 盘古大模型 PanguLargeModels

创建一个训练数据集模型训练自监督训练使用不含有标记的数据进行模型训练。创建自监督微调训练任务有监督训练使用含有标记的数据进行模型训练，以学习输入和输出之间的映射关系。创建有监督训练任务模型评估创建模型评估任务训练完成后评估模型的回答效果。创建模型评估任务查看模型评估结果

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

表1 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 6 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.013

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

表2 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 4 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.01

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

问答模型的微调核心参数设置训练参数设置值数据批量大小（batch_size） 4 训练轮数（epoch） 3 学习率（learning_rate） 3e-6 学习率衰减比率（learning_rate_decay_ratio） 0.01 热身比例（warmup） 0.1 评估和优化模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
多轮对话 - 盘古大模型 PanguLargeModels

f6785c", "created": 1687933298, "choices": [{"message": {"content": "学习"}}]} data:{"id": "cc4dfd25-27d0-41ca-a940-c78313f6785c", "created":

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型

总条数： 32

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

文本补全 - 盘古大模型 PanguLargeModels

盘古大模型套件使用流程 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

多轮对话 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线