搜索_华为云

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

微调图片+检测标注图片+xml 训练CV大模型所需数据量初期启动训练时，每种模型类别先提供1000张已标注的图片数据进行训练，后续根据验证结果再动态提供数据迭代。图片中需要识别的目标是清晰可见的，没有遮挡、模糊等特征破坏问题。图片中的目标大小显著，目标物体在不放大图片的情况下人眼清晰可见。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
成长地图 - 盘古大模型 PanguLargeModels

如何利用提示词提高大模型在难度较高推理任务中的准确率？如何让大模型按指定风格或格式回复？如何分析大模型输出错误回答的根因？为什么其他大模型适用的提示词在盘古大模型上效果不佳？更多技术专题技术、观点、课程专题呈现云图说通过云图说，带您了解华为云 OCR基础课程介绍文字识别服务的产品、技术指导和使用指南

 帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
标注图片类数据集 - 盘古大模型 PanguLargeModels

如图1，以标注图片Caption数据为例，逐一标注图片的Caption描述，下方展示了AI预标注的Caption。图1 图片类数据集标注示例一条数据标注完成后，单击“提交”可继续标注剩余数据。所有数据标注完成后，页面会出现标注任务成功的提示。如果在创建标注任务时设置了“AI预标注 > 可部分标注”，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。图片去重通过把图片结构化处理后，过滤重复的图片/图文对数据。数据打标

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，before文件夹：包含变化前的图片，每幅图片需与变化后的图片同名、同尺寸。 after文件夹：包含变化后的图片，每幅图片需与变化前的图片同名、同尺寸。 label文件夹：包含与变化前和变化后图片同名、同尺寸的PNG文件。每个像素值代表该位置对应的类别信息，类别应是连续的且从0开始。视频分类图片导

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
流通图片类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个图片类数据集支持发布的格式为：默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。创建文本类数据集流通任务步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集创建图片类数据集评估标准 ModelArts Studio大模型开发平台针对图片类数据集预设了一套基础评估标准，涵盖了图像清晰度、分辨率、标签准确性、图像一致性等多个质量维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

据如下特征过滤：待保留的词个数。待保留的平均词长度。段落结尾不完整句子过滤按照句子的过滤粒度，自动识别段落结尾处的内容是否完整，如果不完整，则过滤。广告数据过滤按照句子的过滤粒度，删除文本中包含广告数据的句子。 QA对过滤过滤包含以下情况的QA对：问题不是string格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
清洗图片类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集清洗图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建图片类数据集清洗任务创建图片类数据集清洗任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

识别视频中是否包含水印。字幕识别识别视频中是否包含字幕。 Logo识别识别视频中是否包含Logo。视频黑边识别识别视频中是否包含黑边。密集文字识别识别视频中是否包含密集文字，达到密集文字面积占比的视频则为含密集文字视频，一般裁剪面积占比≥7%为密集文字视频。父主题：数据集清洗算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

说明：该模块用于对多轮对话中的省略和指代问题进行补全，对多轮对话中的query进行改写。当前query改写模块来实现训练和预测需要使用特殊的Prompt，需要注意保持一致。中控模块：盘古-NLP-N1-基础功能模型说明：该模块需要实现意图识别分类的功能。当输入意图识别模块的是政务问题时，控

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
Agent开发平台介绍 - 盘古大模型 PanguLargeModels

Agent开发平台是基于NLP大模型，致力打造智能时代集开发、调测和运行为一体的AI应用平台。无论开发者是否拥有大模型应用的编程经验，都可以通过Agent平台快速创建各种类型的智能体。Agent开发平台旨在帮助开发者高效低成本的构建AI应用，加速领域和行业AI应用的落地。针对“零码”开发者（无代码开发经验），

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
工作流介绍 - 盘古大模型 PanguLargeModels

Agent开发平台的工作流由多个节点构成，节点是组成工作流的基本单元。平台支持多种节点，包括开始、结束、大模型、意图识别、提问器、插件、判断、代码和消息节点。创建工作流时，每个节点需要配置不同的参数，如输入和输出参数等，开发者可通过拖、拉、拽可视化编排更多的节点，实现复杂业务流程的编排，从而快速构建应用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
效果评估与优化 - 盘古大模型 PanguLargeModels

意图的准确性。本实践的意图识别节点包含文本翻译意图和其他意图。文本翻译意图：当用户请求翻译时，意图识别节点的关键任务是准确判断用户翻译的需求，执行翻译节点分支，并给出正确的翻译结果。如图1，当用户输入翻译类问题时，“意图识别”节点对用户的意图分类为“文本翻译”，此时工作流将运

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
数据工程 - 盘古大模型 PanguLargeModels

助用户高效构建高质量的训练数据集，推动AI应用的成功落地。具体功能如下：数据获取：用户可以轻松将多种类型的数据导入ModelArts Studio大模型开发平台，支持的数据类型包括文本、图片、视频、气象、预测数据以及用户自定义的其他类型数据。平台提供灵活的数据接入方式以及支持多

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的最大利润和市值是多少？科技行业公司的最小利润和市值是多少？科技行业公司的中位利润和市值是多少？科技行业公司的总利润和市值是多少？ … 来源四：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，再基于大模型（比如盘古提供的任意一个规格的基础功能模

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
方案设计 - 盘古大模型 PanguLargeModels

各节点的功能和设计思路：开始节点：作为工作流的入口，开始节点负责接收用户输入的文本。无论是普通对话文本，还是包含翻译请求的文本，都将从此节点开始。意图识别节点：该节点对用户输入的文本进行分类和分析，识别出用户的意图。主要包括以下两种意图：文本翻译意图：系统识别出用户希望进行文本翻译的请求。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
Agent开发 - 盘古大模型 PanguLargeModels

有经验的开发者，都能通过平台提供的提示词工程、插件扩展、灵活的工作流设计和全链路调测功能，快速实现智能体应用的开发与落地，加速行业AI应用的创新与应用。对于零码开发者（无代码开发经验的用户）：平台提供了Prompt提示词工程和插件自定义等功能，帮助用户在无需编写代码的情况下，

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
编排工作流 - 盘古大模型 PanguLargeModels

意图识别节点通过大模型推理分析用户输入，匹配预定义的意图关键字类别，并根据识别结果引导至相应的处理流程，通常位于工作流的前置位置。意图识别节点为可选节点，若无需配置，可跳过该步骤。意图识别节点配置步骤如下：拖动左侧“意图识别”节点至画布中，单击该节点以打开节点配置页面。参照表3，完成意图识别节点的配置。表3

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流

总条数： 58

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

Agent开发平台介绍 - 盘古大模型 PanguLargeModels

工作流介绍 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

方案设计 - 盘古大模型 PanguLargeModels

Agent开发 - 盘古大模型 PanguLargeModels

编排工作流 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线