搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
常见问题 - 盘古大模型 PanguLargeModels

图1 json解析报错服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。 sdk json数据解析问题。建议排查服务端返回的数据是否和服务SDK设计的结构、字段一致。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
包年/包月和按需计费模式哪个更划算 - 盘古大模型 PanguLargeModels

的平均成本和一定的稳定性。对于短期、突发或不可预测的业务需求，按需计费模式则更为合适，因为它提供了更高的灵活性和避免长期预付费可能带来的压力。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据转换图文异常字符过滤将文本数据中携带的异常字符替换为空值，数据条目不变。不可见字符，例如U+0000-U+001F 表情符六网页标签符号<p> 特殊符号，比如● █ ◆ 乱码和无意义的字符�� 父主题：数据集清洗算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
状态码 - 盘古大模型 PanguLargeModels

Unauthorized 在客户端提供认证信息后，返回该状态码，表明服务端指出客户端所提供的认证信息不正确或非法。 402 Payment Required 保留请求。 403 Forbidden 请求被拒绝访问。返回该状态码，表明请求能够到达服务端，且服务端能够理解用户请求，但是拒绝

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
效果评估与优化 - 盘古大模型 PanguLargeModels

多场景测试：对多种不同场景下的prompt进行测试，确保在各种情境下系统能够有效响应：不同语言对的翻译：如图3，针对不同的语言对（如中文到法语、俄语到西班牙语），评估翻译效果是否稳定。图3 多场景测试-不同语言对复杂对话场景：如图4，当用户在对话中频繁切换意图时，测试意图识

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

查找数据集每一条数据中携带的异常字符，并将异常字符替换为空值，数据条目不变。不可见字符，比如U+0000-U+001F。表情符六。网页标签符号<style></style>。特殊符号，比如● █ ◆。乱码和无意义的字符��。特殊空格：[\u2000-\u2009]

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下只有1个数据文件时，文件无命名要求。目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样，如train01.csv；验证数据名称需包含eval字样；测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据源样本为avi、mp4格式，标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。支持视频的格式包括常见的mp4/avi格式文件，每个视频时长要大于128s，FPS>=10，用annotation.json对文件进行标注。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据工程介绍 - 盘古大模型 PanguLargeModels

据集格式要求。表1 平台支持的数据类型数据类型数据内容支持的文件格式文本类文档 txt、mobi、epub、docx、pdf 网页 html 预训练文本 jsonl 单轮问答 jsonl、csv 单轮问答（人设） jsonl、csv 多轮问答 jsonl 多轮问答（人设）

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

使得权重值趋于较小，从而提高模型的泛化性能。滑动平滑训练一种训练策略，通过在模型预测的标签上添加少量噪声来避免过拟合，常用于提升模型在测试数据集上的泛化能力。极大值抑制阈值在预测多个边界框时，用于去除高度重叠的边界框。此阈值控制相似的边界框保留的条件。类别无关极大值抑制开关

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
管理知识库 - 盘古大模型 PanguLargeModels

管理知识库 Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

来源一：互联网开源数据集，如政府网站网页、政府在线问答公开数据、政务百科等。来源二：特定的私域数据，针对于具体场景和项目需求，收集相关的文本数据。比如通过与当地政府的政数局进行合作，获取政府部门提供的内部脱敏数据等。相关的数据格式包括但不限于：在线网页、离线word文档、离线txt文

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
文本对话 - 盘古大模型 PanguLargeModels

默认值为false，如果开启流式，请赋值true，同时n参数只能设置为1。开启流式开关后，API会在生成文本的过程中，实时地将生成的文本发送给客户端，而不是等到生成完成后一次性将所有文本发送给客户端。 temperature 否 Float 用于控制生成文本的多样性和创造力。取值接近0表示最低的随机性，1表示

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
创建知识库 - 盘古大模型 PanguLargeModels

上角“继续上传”，上传本地文件。知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。知识库命中测试步骤如下：登录ModelArts Studi

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。网页 html 单个文件大小不超过50GB，文件数量最多1000个。预训练文本 jsonl jsonl格式：text表示预训练所使用的文本数据，具体格式示例如下：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

需要保障在图片中人眼能清晰辨别目标。图片分辨率大于640x640 px，关于拍摄角度、距离、分辨率等画面拍摄条件，需要保证训练集图片和测试部署时的图片保持一致。构建CV大模型数据集流程在ModelArts Studio大模型开发平台中，使用数据工程构建盘古CV大模型数据集流程见表2。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

是否正确。可以在“创建导入任务”页面下载数据样例进行比对。使用Python脚本转换自定义格式为jsonl格式对于文本类数据集，除文档、网页数据类型，其余类型的数据支持将自定义格式转换为jsonl格式。用户可以上传自定义的python脚本实现数据集由自定义格式到jsonl格式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集

总条数： 19

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式哪个更划算 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线