搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置得过小，导致模型的收敛速度太慢，无法达到最优解。您可以尝试增大训练轮数或者增大学习率的方式来解决。图4 异常的Loss曲线：平缓且保持高位 Loss曲线异常抖动：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

数据批量大小是指对数据集进行分批读取训练时，所设定的每个批次数据大小。批量大小越大，训练速度越快，但是也会占用更多的内存资源，并且可能导致收敛困难或者过拟合；批量大小越小，内存消耗越小，但是收敛速度会变慢，同时模型更容易受到数据噪声的影响，从而导致模型收敛困难。您可根据数据和模型的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
手工编排Agent应用流程 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“Agent开发”，将跳转至Agent开发平台。单击左侧导航栏“工作台”，在“应用”页签，单击右上角“创建应用”。您也可以鼠标单击已有应用右上角的，进行应用的复制、删除、复制ID操作。在“创建应用”窗口中，填写应用名称与应用描述，单击左下角的图片可更换应用图标，单击“确定”，进入应用详情页面。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 手工编排Agent应用
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
管理工作流 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，进入所需空间。在左侧导航栏中选择“Agent开发”，将跳转至Agent开发平台。单击左侧导航栏“工作台”，在“工作流”页签中，鼠标右键单击工作流，进行工作流的复制、复制ID、删除。父主题：创建与管理工作流

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理工作流
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下只有1个数据文件时，文件无命名要求。目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字眼，如train01.csv；验证数据名称需包含eval字眼；测试数据名称需包含test字眼。文件的命名不能同时包含train、eval和test中的两个或三个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
创建文本类数据集评估任务 - 盘古大模型 PanguLargeModels

在评估页面，可参考评估项对当前数据的问题进行标注，且不满足时需要单击“不通过”，满足则单击“通过”。对于文本类数据集而言，可选择问题内容后，单击鼠标右键进行数据问题的标注。图7 标记数据集问题全部数据评估完成后，评估状态显示为“100%”，表示当前数据集已经评估完成，可以回退到“评

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估文本类数据集
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

、全球海浪高度。全球海洋要素：实现预测全球范围内海面高度，温度、盐度、海流速度纬向分量和海流速度经向分量变量。区域海洋要素：实现预测特定区域范围内海面高度，温度、盐度、海流速度纬向分量和海流速度经向分量变量。全球海洋生态：实现预测全球范围内的叶绿素浓度、硅藻浓度等8种生态变量。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
模型开发 - 盘古大模型 PanguLargeModels

模型压缩：在模型部署前，进行模型压缩是提升推理性能的关键步骤。通过压缩模型，能够有效减少推理过程中的显存占用，节省推理资源，同时提高计算速度。当前，平台支持对NLP大模型进行压缩。模型部署：平台提供了一键式模型部署功能，用户可以轻松将训练好的模型部署到云端或本地环境中。平台支

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
压缩NLP大模型 - 盘古大模型 PanguLargeModels

提高推理性能。当前仅支持对NLP大模型进行压缩。采用的压缩方式是INT8，INT8量化压缩可以显著减小模型的存储大小，降低功耗，并提高计算速度。登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“模型开发 > 模型压缩

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

学习率学习率决定了每次训练时模型参数更新的幅度。选择合适的学习率非常重要：如果学习率太大，模型可能会无法收敛；如果学习率太小，模型的收敛速度会变得非常慢。优化器优化器参数指的是用于更新模型权重的优化算法的相关参数，可以选择adamw。 adamw是一种改进的Adam优化器，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

用于定义学习率的大小。学习率决定了模型参数在每次更新时变化的幅度。如果学习率过大，模型可能会在最优解附近震荡而无法收敛。如果学习率过小，模型收敛的速度可能会非常慢。当batch_size减小时，学习率也应相应地线性减小。预训练时，默认值为：0.00001，范围为[0, 0.001] 学习率调整策略

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
应用场景 - 盘古大模型 PanguLargeModels

动等时效性场景，智能客服无回答能力。提高服务效率：大模型智能客服可以7x24小时不间断服务，相较于人工客服，可以处理更多的客户咨询，且响应速度快；降低运营成本：企业可以通过智能客服处理大部分的常规问题，将人工客服释放出来处理更复杂、更个性化的客户需求；个性化服务：基于大模型的智能

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持文本类数据集的加工操作，分为数据提取、数据转换、数据过滤三类，文本类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

avi或.mp4格式，标注格式为.json。必须包含两个及以上后缀名字为avi或mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。数据集最大100万个文件，单文件最大10GB，整个数据集最大10TB。支持视频的格式包括常见的mp4和或avi格式文

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求

总条数： 16

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

手工编排Agent应用流程 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

管理工作流 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

创建文本类数据集评估任务 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线