搜索_华为云

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，before文件夹：包含变化前的图片，每幅图片需与变化后的图片同名、同尺寸。 after文件夹：包含变化后的图片，每幅图片需与变化前的图片同名、同尺寸。 label文件夹：包含与变化前和变化后图片同名、同尺寸的PNG文件。每个像素值代表该位置对应的类别信息，类别应是连续的且从0开始。视频分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

empty. 检查数据集文件是否还存在于原先的OBS桶中。 download obs file failed. 请检查网络是否正常，是否可以访问OBS桶中的数据。数据评估 annotate type is invalid. 请检查上传的数据中，使用的数据标注类型、数据标注要求与平台要求的是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持文本类数据集的清洗操作，分为数据提取、数据转换、数据过滤三类，文本类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

“核采样”等参数的设置，适当增大其中一个参数的值，可以提升模型回答的多样性。数据质量：请检查训练数据中是否存在文本重复的异常数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。图片去重通过把图片结构化处理后，过滤重复的图片/图文对数据。数据打标图片鉴黄评分对图片的涉黄程度进行评分，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
与其他服务的关系 - 盘古大模型 PanguLargeModels

与其他服务的关系与对象存储服务的关系盘古大模型使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

'EQUAL-TO'}]}}"} 数据量级要求：本场景使用了30000条数据进行微调。类似场景需要的微调数据量视具体情况而定，从经验上来说，若实际场景相对简单和通用，使用几千条数据即可；若场景复杂或专业，则需要上万条数据。数据质量要求：保证数据的分布和目标需要与实际场景匹配。保证数据的覆盖度：数据

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳提示词与训练数据的相似度关系。提示词的效果通常与训练数据的相似度密切相关。当提示词的内容与模型在训练过程中接触过的样本数据相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果不完整，出现了异常截断。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“最大Token限制”参数的设置，适当增加该参数的值，可以增

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

组装为有监督数据。使用模型构建的优点是数据丰富度更高，缺点是成本较高。当您将无监督数据构建为有监督数据时，请尽可能保证数据的多样性。建议将不同文本构建为不同的场景，甚至将同一段文本构建为多个不同的场景。不同规格的模型支持的长度不同，当您将无监督数据构建为有监督数据时，请确保数据长度符合模型长度限制。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

比如，当前是第三轮对话，数据中的问题字段需要包含第一轮的问题、第一轮的回答、第二轮的问题、第二轮的回答以及第三轮的问题，答案字段则为第三轮的回答。以下给出了几条多轮问答的数据样例供您参考：原始对话示例： A：你是谁？ B：您好，我是盘古大模型。 A：你可以做什么？ B：我可以做很多事情，比如xxxx

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
知识库介绍 - 盘古大模型 PanguLargeModels

平台提供了知识库功能来管理和存储数据，支持为应用提供自定义数据，并与之进行互动。知识库支持导入以下格式的本地文档：文本文档数据。支持上传常见文本格式，包括：txt、doc、docx、pdf、ppt、pptx格式。表格数据。支持上传常见的表格文件格式，便于管理和分析结构化数据，包括：xlsx、xls、csv格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

Studio大模型开发平台的空间资产中，包括数据和模型两类资产。这些资产为用户提供了集中管理和高效操作的基础，便于用户实现统一查看和操作管理。数据资产：用户已发布的数据集将作为数据资产存放在空间资产中。用户可以查看数据集的详细信息，包括数据格式、大小、配比比例等。同时，平台支持数据集的删除等管理

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

练。请注意，所选的数据集必须包含您想要添加的新要素。此外，您还可以通过训练更改所有的模型参数，以优化模型性能。微调：微调是将新数据应用于已有模型的过程。它适用于不改变模型结构参数和引入新要素的情况。如果您有新的观测数据，可以使用微调来更新模型的权重，以适应新数据。中期海洋智能预测模型的训练类型选择建议：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
常见问题 - 盘古大模型 PanguLargeModels

json解析报错服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。 sdk json数据解析问题。建议排查服务端返回的数据是否和服务SDK设计的结构、字段一致。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考

总条数： 179

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

与其他服务的关系 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

知识库介绍 - 盘古大模型 PanguLargeModels

盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线