搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常评估模型效果的方法有很多，通常可以从以下几个方面来评估模型训练效果： Loss曲线：通过Loss曲线的变化趋势来评估训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。 Prompt设置：请检查您使用的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程介绍科学计算大模型的训练主要分为两个阶段：预训练与微调。预训练阶段：预训练是模型学习基础知识的过程，基于大规模通用数据集进行。例如，在区域海洋要素预测中，可以重新定义深海变量、海表变量，调整深度层、时间分辨率、水平分辨率以及区域范围，以适配自定义区域的模型场景。此阶段需预先准备区域的高精度数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

s，并绘制成Loss曲线，来观察其变化趋势。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。以下给出了几种正常的Loss曲线形式：图1 正常的Loss曲线：平滑下降图2 正常的Loss曲线：阶梯下降如果您发现

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
调优典型问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的“训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好？

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
大模型开发基本概念 - 盘古大模型 PanguLargeModels

保持或接近模型的最佳性能。过拟合过拟合是指为了得到一致假设而使假设变得过度严格，会导致模型产生“以偏概全”的现象，导致模型泛化效果变差。欠拟合欠拟合是指模型拟合程度不高，数据距离拟合曲线较远，或指模型没有很好地捕捉到数据特征，不能够很好地拟合数据。损失函数损失函数（Loss

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
训练参数优化 - 盘古大模型 PanguLargeModels

科学计算大模型的学习率调优策略如下：学习率太小时，损失曲线几乎是一条水平线，下降非常缓慢，此时可以增大学习率，使用学习率预热（Warm-up）的方法，在训练初期逐步增加学习率，避免初始阶段学习率过小。学习率太大时，损失曲线剧烈震荡，甚至出现梯度爆炸的问题，可以使用学习率衰减（De

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
优化训练超参数 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：大模型微调训练类

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍大模型（Large Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

Prop，可以调整学习率。取值范围：(0,1)。权重衰减系数通过在损失函数中加入与模型权重大小相关的惩罚项，鼓励模型保持较小的权重，防止过拟合或模型过于复杂，取值需≥0。学习率学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、结构和语言的理解，因此，提示词中包含的关键词、句式和语境如果与训练数据中的模式接近，模型能够“回忆”并运用已学习的知识和指令。不同模型间效果差异。由于不同厂商采用的训练策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
构建微调训练任务 - 盘古大模型 PanguLargeModels

计相当于RMSProp，可以调整学习率。取值范围：(0,1)。权重衰减系数用于定义权重衰减的系数。权重衰减是一种正则化技术，可以防止模型过拟合。取值需≥0。学习率用于定义学习率的大小。学习率决定了模型参数在每次更新时变化的幅度。如果学习率过大，模型可能会在最优解附近震

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

延长每次训练时间。学习率衰减比率用于控制训练过程中学习率下降的幅度。计算公式为：最低学习率 = 初始学习率 × 学习率衰减比率。学习率学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。如果学习率过小，模型的收敛速度将变得非常慢。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

景的一个Loss曲线示例如下：图1 Loss曲线通过观察，该Loss曲线随着迭代步数的增加呈下降趋势直至稳定，证明整个训练状态是正常的。若Loss曲线呈现轻微阶梯式下降，为正常现象。模型持续优化：本场景采用了下表中的推理参数进行解码，您可以在平台部署后参考如下参数调试：表3

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型

总条数： 53

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

训练参数优化 - 盘古大模型 PanguLargeModels

优化训练超参数 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

构建微调训练任务 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线