搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下只有1个数据文件时，文件无命名要求。目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样，如train01.csv；验证数据名称需包含eval字样；测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

描述填写评测任务描述。参数填写完成后，单击“立即创建”，回退至“模型评测 > 人工评测”页面。当状态为“待评测”时，可以单击操作列“在线评测”进入评测页面。依据页面提示对评估效果区域进行评测打分，全部数据评测完成后单击“提交”。图1 人工评测示例在“人工测评”页面，评

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
管理知识库 - 盘古大模型 PanguLargeModels

管理知识库 Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据源样本为avi、mp4格式，标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。支持视频的格式包括常见的mp4/avi格式文件，每个视频时长要大于128s，FPS>=10，用annotation.json对文件进行标注。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
微调典型问题 - 盘古大模型 PanguLargeModels

练不稳定。可能会引发如下问题：模型对异常值过度敏感，导致拟合异常值而非整体数据分布。训练过程中损失波动较大，甚至出现梯度爆炸。模型在测试集上表现不佳，泛化能力差。通过统计学方法如计算四分位距、Z-score、样本分布等排查异常值。通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
效果评估与优化 - 盘古大模型 PanguLargeModels

多场景测试：对多种不同场景下的prompt进行测试，确保在各种情境下系统能够有效响应：不同语言对的翻译：如图3，针对不同的语言对（如中文到法语、俄语到西班牙语），评估翻译效果是否稳定。图3 多场景测试-不同语言对复杂对话场景：如图4，当用户在对话中频繁切换意图时，测试意图识

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
使用推理SDK - 盘古大模型 PanguLargeModels

@huaweicloud/huaweicloud-sdk-core npm i @huaweicloud/huaweicloud-sdk-pangulargemodels 在线生成SDK代码 API Explorer可根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。您可以在API Explor

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
数据预处理优化 - 盘古大模型 PanguLargeModels

练不稳定。可能会引发如下问题：模型对异常值过度敏感，导致拟合异常值而非整体数据分布。训练过程中损失波动较大，甚至出现梯度爆炸。模型在测试集上表现不佳，泛化能力差。优化调整策略如下：通过统计学方法如计算四分位距、Z-score、样本分布等排查异常值。通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
创建知识库 - 盘古大模型 PanguLargeModels

上角“继续上传”，上传本地文件。知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。知识库命中测试步骤如下：登录ModelArts Studi

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古专业大模型支持的具体操作：模型预训练微调模型压缩在线推理能力调测 Pangu-NLP-BI-4K-20241130

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
调优典型问题 - 盘古大模型 PanguLargeModels

练不稳定。可能会引发如下问题：模型对异常值过度敏感，导致拟合异常值而非整体数据分布。训练过程中损失波动较大，甚至出现梯度爆炸。模型在测试集上表现不佳，泛化能力差。通过统计学方法如计算四分位距、Z-score、样本分布等排查异常值。通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古科学计算大模型支持的具体操作：表2 盘古科学计算大模型支持的操作模型预训练微调模型评测模型压缩在线推理能力调测 Pangu-AI4S-Ocean_24h-20241130

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
创建边缘资源池 - 盘古大模型 PanguLargeModels

配置NFS网盘服务。安装NFS服务该步骤需要设备联网下载软件依赖包。 Ubuntu系统在线安装： sudo apt install nfs-kernel-server Euler OS系统在线安装： sudo yum install nfs-utils 若需离线安装，请联系盘古客服。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型资源池
调优典型问题 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

重要。不同模型在预训练、微调、模型评测、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古NLP大模型支持的具体操作：表2 盘古NLP大模型支持的能力模型预训练微调模型评测模型压缩在线推理能力调测 Pangu-NLP-N1-Chat-32K-20241130

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
成长地图 - 盘古大模型 PanguLargeModels

ts Studio大模型开发平台承载，它提供了包括盘古大模型在内的多种大模型服务，提供覆盖全生命周期的大模型工具链。产品介绍立即使用在线体验图说ECS 成长地图由浅入深，带您玩转盘古大模型 01 了解了解盘古大模型的概念、优势、应用场景以及模型能力与规格，您将更全面地

 帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

来源一：互联网开源数据集，如政府网站网页、政府在线问答公开数据、政务百科等。来源二：特定的私域数据，针对于具体场景和项目需求，收集相关的文本数据。比如通过与当地政府的政数局进行合作，获取政府部门提供的内部脱敏数据等。相关的数据格式包括但不限于：在线网页、离线word文档、离线txt文件

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型

总条数： 27

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

微调典型问题 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

使用推理SDK - 盘古大模型 PanguLargeModels

数据预处理优化 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

创建边缘资源池 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线