搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

包括以下几个方面：模型优化与部署：将训练好的大模型部署到生产环境中，可能通过云服务或本地服务器进行推理服务。此时要考虑到模型的响应时间和并发能力。模型监控与迭代：部署后的模型需要持续监控其性能，并根据反馈进行定期更新或再训练。随着新数据的加入，模型可能需要进行调整，以保证其在实际应用中的表现稳定。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

需要保障在图片中人眼能清晰辨别目标。图片分辨率大于640x640 px，关于拍摄角度、距离、分辨率等画面拍摄条件，需要保证训练集图片和测试部署时的图片保持一致。构建CV大模型数据集流程在ModelArts Studio大模型开发平台中，使用数据工程构建盘古CV大模型数据集流程见表2。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
数据工程使用流程 - 盘古大模型 PanguLargeModels

求选择预置标准或自定义评估标准，从而精确优化数据质量，确保数据满足高标准，提升模型性能。配比数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。流通数据集数据流通是将单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下只有1个数据文件时，文件无命名要求。目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样，如train01.csv；验证数据名称需包含eval字样；测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据源样本为avi、mp4格式，标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。支持视频的格式包括常见的mp4/avi格式文件，每个视频时长要大于128s，FPS>=10，用annotation.json对文件进行标注。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

需求选择预置标准或自定义评估标准，从而精确优化数据质量，确保数据满足高标准，提升模型性能。数据配比数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。数据流通数据流通是将单个

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
错误码 - 盘古大模型 PanguLargeModels

确。 APIG.0201 Backend timeout. 请求超时。请检查原调用请求是否过于频繁，如果是并发过大，可以通过重试机制解决，在代码里检查返回值，碰到这个并发错误可以延时一小段时间（如2-5s）重试请求；也可以后端检查上一个请求结果，上一个请求返回之后再发送下一个请求，避免请求过于频繁。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
数据工程介绍 - 盘古大模型 PanguLargeModels

数据评估：数据评估通过对数据集进行系统的质量检查，依据评估标准评估数据的多个维度，旨在发现潜在问题并加以解决。数据配比：将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。数据流通：将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

2024年12月发布版本，支持8K序列长度训练，4K/32K序列长度推理。全量微调32个训练单元起训，LoRA微调8个训练单元起训，4个推理单元即可部署，4K支持64并发，32K支持64并发。此模型版本差异化支持预训练特性、INT8量化特性。 Pangu-NLP-N2-128K-3.1.35 128K 2024年12

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

使得权重值趋于较小，从而提高模型的泛化性能。滑动平滑训练一种训练策略，通过在模型预测的标签上添加少量噪声来避免过拟合，常用于提升模型在测试数据集上的泛化能力。极大值抑制阈值在预测多个边界框时，用于去除高度重叠的边界框。此阈值控制相似的边界框保留的条件。类别无关极大值抑制开关

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

估标准，从而精确优化数据质量，确保数据满足高标准，提升模型性能。评估文本类数据集配比文本类数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比文本类数据集流通文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
配比文本类数据集 - 盘古大模型 PanguLargeModels

配比文本类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通文本类数据集。创建文本类数据集配比任务创建文本类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

batch_size：每个训练步骤中使用的样本数量。 sequence：每个数据样本中的Token数量。数据预处理并发个数定义了在预处理数据时，能够同时处理文件的并行进程数量。设定这个参数的主要目的是通过并发处理来加速数据预处理，从而提升训练效率。数据配置训练数据选择训练模型所需的数据集。资源配置

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
管理知识库 - 盘古大模型 PanguLargeModels

管理知识库 Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
效果评估与优化 - 盘古大模型 PanguLargeModels

多场景测试：对多种不同场景下的prompt进行测试，确保在各种情境下系统能够有效响应：不同语言对的翻译：如图3，针对不同的语言对（如中文到法语、俄语到西班牙语），评估翻译效果是否稳定。图3 多场景测试-不同语言对复杂对话场景：如图4，当用户在对话中频繁切换意图时，测试意图识

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

2024年12月发布版本，支持8K序列长度训练，4K/32K序列长度推理。全量微调32个训练单元起训，LoRA微调8个训练单元起训，4个推理单元即可部署，4K支持64并发，32K支持64并发。此模型版本差异化支持预训练特性、INT8量化特性。 Pangu-NLP-N2-128K-3.1.35 128K 4K 2024

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
创建知识库 - 盘古大模型 PanguLargeModels

上角“继续上传”，上传本地文件。知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。知识库命中测试步骤如下：登录ModelArts Studi

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库

总条数： 25

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

错误码 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

配比文本类数据集 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线