搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议科学计算大模型训练流程介绍科学计算大模型主要用于。科学计算大模型的训练主要分为两个阶段：预训练与微调。预训练阶段：预训练是模型学习基础知识的过程，基于大规模通用数据集进行。例如，在区域海洋要素预测中，可以重新定义深海变量、海表变量，调整深度层、时间

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

型会自带时间分辨率，会根据预设的时间间隔处理和生成预测结果。若训练类型为“预训练”，训练任务使用训练数据重新训练出与基础模型分辨率相同的模型。若训练类型为“微调”，训练任务会使用训练数据在基础模型的基础上进行训练。 plog日志 plog日志。plog日志是一种用来记录模型运

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

decay）的机制，可以有效地防止过拟合（overfitting）的问题。学习率衰减比率学习率衰减后的比率，用于控制训练过程中学习率的下降幅度。经过衰减后，学习率的最低值由初始学习率和衰减比率决定。其计算公式为：最低学习率 = 初始学习率 * 学习率衰减比率。也就是说，学习率在每次衰减后不会低于这个计算出来的最低值。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常判断训练状态是否正常，通常可以通过观察训练过程中Loss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。 Prompt设

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

Token计算器”。 NLP大模型训练类型选择建议平台针对NLP大模型提供了两种训练类型，包括预训练和微调，二者区别详见表3。表3 预训练和微调训练类型区别训练方式训练目的训练数据模型效果应用场景举例预训练关注通用性：预训练旨在让模型学习广泛的通用知识，建立词汇、句法

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
发布训练后的NLP大模型 - 盘古大模型 PanguLargeModels

发布训练后的NLP大模型 NLP大模型训练完成后，需要执行发布操作，操作步骤如下：在模型训练列表页面选择训练完成的任务，单击训练任务名称进去详情页。在“训练结果”页面，单击“发布”。图1 训练结果页面填写资产名称、描述，选择对应的可见性，单击“确定”发布模型。发布后的模型会作为资产同步显示在“空间资产

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
管理NLP大模型训练任务 - 盘古大模型 PanguLargeModels

管理NLP大模型训练任务在训练任务列表中，任务创建者可以对创建好的任务进行编辑、启动、克隆（复制训练任务）、重试（重新训练任务）和删除操作。登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“模型开发 > 模型训练”，进入模型训练页面，可进行如下操作：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标模型启动训练后，可以在模型训练列表中查看训练任务的状态，单击任务名称可以进入详情页查看训练指标、训练任务详情和训练日志。查看模型训练状态在模型训练列表中查看训练任务的状态，各状态说明详见表1。表1 训练状态说明训练状态训练状态含义已发布

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标查看模型训练状态模型启动训练后，可以在模型训练列表中查看训练任务的状态，单击任务名称可以进入详情页查看训练指标、训练任务详情和训练日志。表1 训练状态说明训练状态训练状态含义已发布模型已经训练完成并进行发布，用户可以使用模型进行部署、推理操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
大模型微调训练类问题 - 盘古大模型 PanguLargeModels

大模型微调训练类问题无监督领域知识数据量无法支持增量预训练，如何进行模型学习如何调整训练参数，使盘古大模型效果最优如何判断盘古大模型训练状态是否正常如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
发布训练后的科学计算大模型 - 盘古大模型 PanguLargeModels

发布训练后的科学计算大模型科学计算大模型训练完成后，需要执行发布操作，操作步骤如下：在模型训练列表页面选择训练完成的任务，单击训练任务名称进去详情页。在“训练结果”页面，单击“发布”。图1 训练结果填写资产名称、描述，选择对应的可见性，单击“确定”发布模型。发布后的模型会作为资产同步显示在“空间资产

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
训练NLP大模型 - 盘古大模型 PanguLargeModels

训练NLP大模型 NLP大模型训练流程与选择建议创建NLP大模型训练任务查看NLP大模型训练状态与指标发布训练后的NLP大模型管理NLP大模型训练任务 NLP大模型训练常见报错与解决方案父主题：开发盘古NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
NLP大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

NLP大模型训练常见报错与解决方案 NLP大模型训练常见报错及解决方案请详见表1。表1 NLP大模型训练常见报错与解决方案常见报错问题现象原因分析解决方案创建训练任务时，数据集列表为空创建训练任务时，数据集选择框中显示为空，无可用的训练数据集。数据集未发布。请提

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
管理科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

管理科学计算大模型训练任务在训练任务列表中，任务创建者可以对创建好的任务进行编辑、启动、克隆（复制训练任务）、重试（重新训练任务）和删除操作。登录ModelArts Studio大模型开发平台，进入所需空间。在左侧导航栏中选择“模型开发 > 模型训练”，进入模型训练页面，可进行如下操作：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
科学计算大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

科学计算大模型训练常见报错与解决方案科学计算大模型训练常见报错及解决方案请详见表1。表1 科学计算大模型训练常见报错与解决方案常见报错问题现象原因分析解决方案创建训练任务时，数据集列表为空创建训练任务时，数据集选择框中显示为空，无可用的训练数据集。数据集未发布。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型

总条数： 100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

发布训练后的NLP大模型 - 盘古大模型 PanguLargeModels

管理NLP大模型训练任务 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

大模型微调训练类问题 - 盘古大模型 PanguLargeModels

发布训练后的科学计算大模型 - 盘古大模型 PanguLargeModels

训练NLP大模型 - 盘古大模型 PanguLargeModels

NLP大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

管理科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

科学计算大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线