搜索_华为云

知识库介绍 - 盘古大模型 PanguLargeModels

文本文档数据。支持上传常见文本格式，包括：txt、doc、docx、pdf、ppt、pptx格式。表格数据。支持上传常见的表格文件格式，便于管理和分析结构化数据，包括：xlsx、xls、csv格式。无论是文本文档、演示文稿，还是电子表格文件，用户都可以轻松地将数据导入知识库，无需额外的转换或格式处理。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

truncated：必选字段，取值0或1，表示标注内容是否被截断（0表示被截断、1表示没有截断）。 occluded：必选字段，取值0或1，表示标注内容是否被遮挡（0表示未遮挡、1表示遮挡） difficult：必选字段，取值0或1，表示标注目标是否难以识别（0表示容易识别、1表示难易识别）。 con

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案数据工程常见报错及解决方案请详见表1。表1 数据工程常见报错与解决方案功能模块常见报错解决方案数据获取 File format mismatch, require [{0}]. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

//视频文件扩展名。 // 标注 34.5, 42.4 分别表示起始时间和结束时间，单位为s。 // label 表示分类，必须是classes列表中的一个元素，表示该视频片段对应的事件或动作类型。 'annotations':

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类算子名称算子描述数据提取图文提取提取图文压缩包中的JSON文本和图片，并对图片进行结构化解析（BASE64编码）。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

取、数据转换、数据过滤三类，文本类加工算子能力清单见表1。表1 文本类清洗算子能力清单算子分类算子名称算子描述数据提取 WORD内容提取从Word文档中提取文字，并保留原文档的目录、标题和正文等结构，不保留图片、表格、公式、页眉、页脚。 TXT内容提取从TXT文件中提取所有文本内容。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差当您在微调过程中，发现模型评估的结果很好，一旦将微调的模型部署以后，输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

集文件内容包括：预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1 训练NLP大模型数据集类型要求基模型训练场景数据集类型数据集内容文件格式 NLP 预训练文本预训练文本

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案工作流常见错误码与解决方案工作流常见报错及解决方案请详见表1。表1 工作流节点常见报错与解决方案模块名称错误码错误描述解决方案开始节点 101501 开始节点全局配置未传入值。开始节点错误，请联系客服解决。结束节点 101531

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

训练预测大模型时，所需的数据通常为表格格式，即由行和列组成的扁平化数据。具体要求如下：行：每行代表一个样本。每行与其他行具有相同的列，并且顺序相同，这些行通常按照某种特定顺序排列。列：每列表示一种特征。每列的数据类型应保持一致，不同列可以具有不同的数据类型。顺序：表格中的行通常按照特定顺序排列。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
管理加工后的数据集 - 盘古大模型 PanguLargeModels

管理加工后的数据集完成数据清洗、数据合成、或数据标注任务的数据集，在对应任务列表执行“生成”操作，将生成“加工数据集”被平台统一管理，并用于后续的发布任务。平台支持对加工数据集查看基本信息、数据血缘等管理操作，具体步骤如下：登录ModelArts Studio大模型开发平台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

字，用于描述变量的含义或作用。提示词评估数据集约束限制上传文件限xlsx格式。数据行数不小于10行，不大于50行。数据不允许相同表头，表头数量小于20个。数据单条文本长度不超过1000。创建数据集时会对相关限制条件进行校验。数据参考格式如下：图1 数据参考格式图2

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
管理发布后的数据集 - 盘古大模型 PanguLargeModels

管理发布后的数据集完成数据配比、或数据流通任务的数据集，在对应任务列表执行“生成”操作，将生成“发布数据集”被平台统一管理，并用于后续的发布任务。平台支持对发布数据集查看基本信息、数据血缘等管理操作，具体步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。表1 视频类清洗算子能力清单算子分类算子名称算子描述数据提取镜头拆分根据视频中的镜头场景变化将长视频拆分为短视频片段，如果某个

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

与时序数据不同，回归分类数据不要求数据具有时间顺序。具体格式要求详见表1。表1 预测类数据集格式要求文件内容文件格式文件样例时序 csv 数据为结构化数据，包含列和行，每一行表示一条数据，每一列表示一个特征，并且必须包含预测目标列，预测目标列要求为连续型数据。目录下只有1个数据文件时，文件无命名要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
编排应用 - 盘古大模型 PanguLargeModels

Agent平台支持为应用配置插件、工作流技能，支持接入知识库，还可增加应用的对话体验，详见创建与管理插件、编排工作流、创建与管理知识库。应用编排流程见表1。表1 应用编排流程操作步骤说明步骤1：创建应用创建一个新应用。步骤2：配置Prompt 在应用中配置大模型所需的Prompt。步骤3：添加插件

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

模的要求，还涵盖了数据质量、平衡性和代表性的保证，避免数据不均衡或不具备足够多样性的情况，进而提高模型的准确性和鲁棒性。提高数据的多样性和代表性通过合理的数据配比，帮助用户按特定比例组合多个数据集，确保数据集在不同任务场景下的多样性和代表性。这样可以避免过度偏向某一类数据，保

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

合函数（如去重、计数、平均、最大、最小、合计）、分组、排序、比较、条件（逻辑操作、离散条件、范围区间等条件的混合和嵌套）、日期操作，支持多表关联查询。与非专业大模型相比，专业大模型针对特定场景优化，更适合执行数据分析、报告生成和业务洞察等任务。 ModelArts Studio

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格

总条数： 143

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

知识库介绍 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

编排应用 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线