搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
模型开发 - 盘古大模型 PanguLargeModels

模型训练：在模型开发的第一步，ModelArts Studio大模型开发平台为用户提供了丰富的训练工具与灵活的配置选项。用户可以根据实际需求选择合适的模型架构，并结合不同的训练数据进行精细化训练。平台支持分布式训练，能够处理大规模数据集，从而帮助用户快速提升模型性能。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
Agent开发 - 盘古大模型 PanguLargeModels

平台还提供全链路信息观测和调试工具，支持开发者深入分析Agent执行过程中的每个环节。通过对信息进行分层展示，帮助开发者优化AI应用的性能和稳定性，确保应用在不同环境下的顺畅运行。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

模型开发工具链：模型开发工具链是盘古大模型服务的核心组件，提供从模型创建到部署的一站式解决方案，涵盖模型训练、压缩、部署、评测、调用等功能，保障模型的高效应用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
产品优势 - 盘古大模型 PanguLargeModels

产品优势预置多，数据工程“易” ModelArts Studio大模型开发平台预置多种数据处理AI算子，多种标注工具，满足用户多任务多场景需求，提高开发/标注效率>10X。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
Token计算器 - 盘古大模型 PanguLargeModels

Token计算器功能介绍为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样，如train01.csv；验证数据名称需包含eval字样；测试数据名称需包含test字样。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
效果评估与优化 - 盘古大模型 PanguLargeModels

图3 多场景测试-不同语言对复杂对话场景：如图4，当用户在对话中频繁切换意图时，测试意图识别节点的应答能力，确保其能够理解并适应多变的对话上下文。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
什么是盘古大模型 - 盘古大模型 PanguLargeModels

该工具链提供提示词设计和管理工具，优化大模型的输入提示，提升输出的准确性和相关性。通过可视化编排工具，应用开发工具链加速大模型应用的开发，满足复杂业务需求。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
Agent开发平台介绍 - 盘古大模型 PanguLargeModels

知识型Agent：以大模型为任务执行核心，用户通过配置Prompt、知识库等信息，实现工具自主规划与调用，优点是可零码开发，对话过程更为智能，缺点是当大模型受到输入限制，难以执行链路较长且复杂的流程。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
方案设计 - 盘古大模型 PanguLargeModels

通过集成翻译工具（如机器翻译API、大型语言模型等），可以在保证翻译效率的同时，提升翻译质量，并根据实际场景和用户需求进行灵活调整。本章将详细介绍如何利用不同的节点构建一个高效的多语言文本翻译工作流，并确保不同用户需求（如普通对话、文本翻译）能够被准确识别和处理。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
功能总览 - 盘古大模型 PanguLargeModels

功能总览功能总览全部数据工程工具链模型开发工具链应用开发工具链能力调测应用百宝箱数据工程工具链数据是大模型训练的基础，为大模型提供了必要的知识和信息。

帮助中心 > 盘古大模型 PanguLargeModels > 功能总览
成长地图 - 盘古大模型 PanguLargeModels

盘古大模型能力通过ModelArts Studio大模型开发平台承载，它提供了包括盘古大模型在内的多种大模型服务，提供覆盖全生命周期的大模型工具链。

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
应用介绍 - 盘古大模型 PanguLargeModels

用户通过配置Prompt、知识库等信息，使得大模型能够自主规划和调用工具。优点：零代码开发，对话过程智能化。缺点：大模型在面对复杂的、长链条的流程时可能会受到输入长度限制，难以有效处理较为复杂的工作流。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
数据预处理优化 - 盘古大模型 PanguLargeModels

模型在测试集上表现不佳，泛化能力差。优化调整策略如下：通过统计学方法如计算四分位距、Z-score、样本分布等排查异常值。通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
权限管理 - 盘古大模型 PanguLargeModels

模型开发工程师可以执行模型开发工具链模块的所有操作，但是不能创建或者删除计算资源，也不能修改所在空间本身。应用开发工程师应用开发工程师具备执行应用开发工具链模块所有操作的权限，其余角色不具备。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
管理知识库 - 盘古大模型 PanguLargeModels

管理知识库 Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
概述 - 盘古大模型 PanguLargeModels

调用工作流 Token计算器为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
创建知识库 - 盘古大模型 PanguLargeModels

知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库

总条数： 30

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

Agent开发 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

Token计算器 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

Agent开发平台介绍 - 盘古大模型 PanguLargeModels

方案设计 - 盘古大模型 PanguLargeModels

功能总览 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

应用介绍 - 盘古大模型 PanguLargeModels

数据预处理优化 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线