搜索_华为云

加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集加工图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建图片类数据集加工任务创建图片类数据集加工任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集加工图片类数据集标注图片类数据集配比图片类数据集父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
标注图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集创建图片类数据集标注任务标注图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。数据标注功能支持创建标注任务、标注数据集（标注作业）、审核标注后的数据集（审核作业）与管理标注任务（任务管理）。其中，不同角色权限支持的功能及展示的前端界面略有差异，详见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

"caption":"图片对应的文本描述"} 单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。图片+QA对图片支持tar，QA对支持jsonl 图片：图片以tar包格式存储，可以多个tar包。tar包存储原始的图片，每张图片命名要求唯一（如abc.jp

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

文本、视频、预测和其他类（自定义）数据集支持文件夹或单个文件导入，导入界面提示用户：“请选择文件夹或文件”。图1 支持导入单个文件示例图片、视频（事件检测）、气象类数据集仅支持文件夹导入，导入界面提示用户：“请选择文件夹”。图2 不支持导入单个文件示例父主题：大模型使用类

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类
图片类加工算子介绍 - 盘古大模型 PanguLargeModels

通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。图片去重通过把图片结构化处理后，过滤重复的图片/图文对数据。数据打标图片鉴黄评分对图片的涉黄程度

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至发布图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集发布图片类数据集前，ModelArts Studio大模型开发平台支持对数据集进行评估操作，帮助用户优化数据质量，确保数据满足高标准，提升模型性能。如果无需使用数据评估操作，可跳过此章节至发布图片类数据集。创建图片类数据集评估标准 ModelArts Stu

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集数据发布是将数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。图片类数据集支持发布的格式为：标准格式：如图1，平台默认的格式。该格式的数据集可发布到资产中，但下游模型开发不可见。图1 图片类数据集标准格式示例盘古格式：如图2，训练盘古大

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
文本类加工算子介绍 - 盘古大模型 PanguLargeModels

表1 文本类加工算子能力清单算子分类算子名称算子描述数据提取 WORD内容提取从Word文档中提取文字，并保留原文档的目录、标题和正文等结构，不保留图片、表格、公式、页眉、页脚。 TXT内容提取从TXT文件中提取所有文本内容。 CSV内容提取从CSV文件中读取所

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集评估图片类数据集发布图片类数据集父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
视频类加工算子介绍 - 盘古大模型 PanguLargeModels

95可视为视频基础质量较高的视频。水印识别识别视频中是否包含水印。字幕识别识别视频中是否包含字幕。 Logo识别识别视频中是否包含Logo。视频黑边识别识别视频中是否包含黑边。密集文字识别识别视频中是否包含密集文字，达到密集文字面积占比的视频则为含密集文字视频，一般裁剪面积占比≥7%为密集文字视频。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

结构化数据，如文档，可以利用大模型+外挂检索库（如Elastic Search）的方式快速实现问答系统，称为检索增强生成（Retrieval Augmented Generation，RAG）技术方案。检索增强生成方案被大量用在智能问答场景中，也称为检索增强问答，如政务问答场景，行业客服智能问答场景等。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
数据工程 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，支持的数据类型包括文本、图片、视频、气象、预测数据以及用户自定义的其他类型数据。平台提供灵活的数据接入方式以及支持多种文件格式导入，确保不同业务场景下的数据获取需求得到满足。数据加工：平台提供强大的数据加工功能，可以对文本、视频、图片、气象类型的数据进行数据提取、过滤

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程介绍 - 盘古大模型 PanguLargeModels

jsonl 图片类仅图片 jpg、jpeg、png、bmp、tar包图片+Caption 图片格式支持：jpg、jpeg、png、bmp，所有图片需保存为tar包。 Caption格式支持：jsonl 图片+QA对图片格式支持：jpg、jpeg、png、bmp，所有图片需保存为tar包。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
创建知识库 - 盘古大模型 PanguLargeModels

ent开发平台。单击左侧导航栏“工作台”，在“知识库”页签，单击右上角“创建知识库”。在“创建知识库”页面，填写知识库名称与描述，单击图片可上传知识库图标，单击“下一步”。在“文件类型”页面，选择文件类型。导入文本文档数据。支持上传txt、doc、docx、pdf、ppt

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
工作流介绍 - 盘古大模型 PanguLargeModels

Agent开发平台的工作流由多个节点构成，节点是组成工作流的基本单元。平台支持多种节点，包括开始、结束、大模型、意图识别、提问器、插件、判断、代码、知识检索和消息节点。创建工作流时，每个节点需要配置不同的参数，如输入和输出参数等，开发者可通过拖、拉、拽可视化编排更多的节点，实现复杂业务流程的编排，从而快速构建应用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
效果评估与优化 - 盘古大模型 PanguLargeModels

mpt是与大模型或其他节点（如翻译插件）交互的核心，它直接影响工作流响应的准确性和效果。因此，效果评估与优化应从以下几个方面进行详细分析：评估工作流响应的准确性：从工作流响应准确性维度看，本实践可以评估意图识别节点响应意图的准确性。本实践的意图识别节点包含文本翻译意图和其他意图。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
创建插件 - 盘古大模型 PanguLargeModels

Agent开发平台。单击左侧导航栏“工作台”，在“插件”页签，单击右上角“创建插件”。在“创建插件”页面，填写插件名称与插件描述，单击图片可上传插件图标，单击“下一步”。在“配置信息”页面，参照表1完成信息配置。表1 插件信息配置说明参数名称参数说明插件URL 插件服务的请求URL地址。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件

总条数： 63

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

图片类加工算子介绍 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

文本类加工算子介绍 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

视频类加工算子介绍 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

工作流介绍 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线