搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差当您在微调过程中，发现模型评估的结果很好，一旦将微调的模型部署以后，输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
与其他服务的关系 - 盘古大模型 PanguLargeModels

与其他服务的关系与对象存储服务的关系盘古大模型使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
配置服务访问授权 - 盘古大模型 PanguLargeModels

Studio大模型开发平台使用对象存储服务（Object Storage Service，简称OBS）进行数据存储，实现安全、高可靠和低成本的存储需求。因此，为了能够顺利进行存储数据、训练模型等操作，需要用户配置访问OBS服务的权限。配置OBS访问授权步骤如下：登录ModelArts Studio大模型开发平台首页。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中一个参数的值，可以提升模型回答的确定性，避免生成异常内容。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建多语言文本翻译插件 - 盘古大模型 PanguLargeModels

请求体参数配置完成后，单击“调试”，在响应结果中单击“响应头”，其中，X-Subject-Token参数的值为获取到的Token，如图4。图4 获取Token值获取的文本翻译API调用地址。华北-北京四区域的调用地址的格式如下： https://nlp-ext.cn-north-4.myhuaweicloud

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流 > 附录
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据发布功能通过数据评估和配比，确保发布的数据集满足大模型训练的高标准。这不仅包括数据规模的要求，还涵盖了数据质量、平衡性和代表性的保证，避免数据不均衡或不具备足够多样性的情况，进而提高模型的准确性和鲁棒性。提高数据的多样性和代表性通过合理的数据配比，帮助用户按特定比例组合多个数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
错误码 - 盘古大模型 PanguLargeModels

访问的API与已开通的API服务不匹配。请确认调用的API是否填写错误。 PANGU.3315 The accessed API's model instance is not public. API模型实例未公开。请检查是否具备盘古大模型服务的使用权限，或联系服务运维人员协助解决。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
发布提示词 - 盘古大模型 PanguLargeModels

通过横向比较提示词效果和批量评估提示词效果，如果找到高质量的提示词，可以将这些提示词发布至“提示词模板”中。在提示词“候选”页面，选择质量好的提示词，并单击“保存到模板库”。图1 保存提示词至模板库进入“Agent 开发 > 提示词工程 > 提示词模板”页面，查看发布的提示词。父主题：开发盘古大模型提示词工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程
审计 - 盘古大模型 PanguLargeModels

云审计服务（Cloud Trace Service，CTS）是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务并创建、配置追踪器后，CTS可记录用户使用盘古的管理事件和数据事件用于审计。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
数据工程使用流程 - 盘古大模型 PanguLargeModels

高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。数据工程操作流程见图1、表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

ERA5是由欧洲中期天气预报中心（ECMWF）提供的全球气候的第五代大气再分析数据集，它覆盖从1940年1月至今的时间段，提供每小时的大气、陆地和海洋气候变量的估计值。 ERA5数据下载官方指导：https://confluence.ecmwf.int/display/CKB/

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：数据集清洗算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据工程 - 盘古大模型 PanguLargeModels

提升数据治理的效率和效果。通过整合上述功能，数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集，还通过全流程的数据处理和管理，探索数据与模型性能的内在联系，为模型训练和应用提供坚实的数据基础，推动了模型的精确训练与持续优化，提升了AI应用开发的效率和成果的可靠性。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
方案设计 - 盘古大模型 PanguLargeModels

各节点的功能和设计思路：开始节点：作为工作流的入口，开始节点负责接收用户输入的文本。无论是普通对话文本，还是包含翻译请求的文本，都将从此节点开始。意图识别节点：该节点对用户输入的文本进行分类和分析，识别出用户的意图。主要包括以下两种意图：文本翻译意图：系统识别出用户希望进行文本翻译的请求。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

生成的内容结尾必须要引导观众购买； 6.生成的内容必须紧扣产品本身，突出产品的特点，不能出现不相关的内容； 7.生成的内容必须完整，必须涵盖产品介绍中的每个关键点，不能丢失任何有价值的细节； 8.生成的内容必须符合客观事实，不能存在事实性错误； 9.生成的内容必须语言通顺； 10.生成的内容中不能出现“带货口播”等这一类字样；

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频鉴黄评分对视频的涉黄程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥50分的视频可视为涉黄视频。视频暴恐评分对视频的暴恐程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥50分的视频可视为暴恐视频。视频涉政评分对视频的涉政程度进行评分，分数越高越危险。评分范围(0

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

模型训练的标准，是数据工程中的核心环节。数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。数据合成利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”之前的内容，引言之前的内容与知识无关：[\s\S]{0，10000}0 引言针对pdf的内容，去除“1.1Java简介”之前的与知识无关的内容：[\s\S]{0，10000}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍

总条数： 111

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

与其他服务的关系 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

配置服务访问授权 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

创建多语言文本翻译插件 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

错误码 - 盘古大模型 PanguLargeModels

发布提示词 - 盘古大模型 PanguLargeModels

审计 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

方案设计 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线