搜索_华为云

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 CV大模型支持接入的数据集类型盘古CV大模型支持接入图片类、视频类、其他类数据集，，不同模型所需数据见表1，数据集格式要求请参见图片类数据集格式要求、视频类数据集格式要求、其他类数据集格式要求。表1 训练CV大模型数据集类型要求基模型训练场景

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

CV大模型训练流程与选择建议 CV大模型训练流程介绍目前，CV大模型支持微调训练。微调阶段：微调阶段通过在特定领域的数据集上进一步训练，使模型能够更有效地应对具体的任务需求。在微调过程中，通过设定训练指标来监控模型的表现，确保其达到预期的效果。完成微调后，将对用户模型进行评估

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
数据工程介绍 - 盘古大模型 PanguLargeModels

数据工程介绍数据工程介绍数据工程是ModelArts Studio大模型开发平台（下文简称“平台”）为用户提供的一站式数据处理与管理功能，旨在通过系统化的数据获取、加工、发布等过程，确保数据能够高效、准确地为大模型的训练提供支持，帮助用户高效管理和处理数据，提升数据质量和处理效率，为大模型开发提供坚实的数据基础。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作，不支持数据加工操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古CV大模型能力与规格盘古CV大模型基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型，赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。 ModelArts Studio大模型开发平台为用户提供了多种规格的CV大模型，以满足不同场景和需求。以下是当前支持的模型

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据集发布场景介绍数据发布介绍 ModelArts Studio大模型开发平台提供的数据发布功能涵盖数据评估、数据配比和数据流通操作，旨在通过数据质量评估和合理的比例组合，确保数据满足大模型训练的多样性、平衡性和代表性需求，促进数据的高效流通和应用。数据发布不仅包括将数据发布

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据工程使用流程 - 盘古大模型 PanguLargeModels

数据工程使用流程高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
构造请求 - 盘古大模型 PanguLargeModels

构造请求本节介绍REST API请求的组成，并以调用服务的获取用户Token接口说明如何调用API。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987 。请求示例如图1，一个请求主要由请求U

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 ModelArts Studio大模型开发平台支持创建图片类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 图片类数据集格式要求文件内容文件格式文件要求仅图片 tar、图片目录图片：支持jpg、jpeg、png、bmp类型。 ta

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据集加工场景介绍数据加工介绍 ModelArts Studio大模型开发平台提供数据加工功能，涵盖了数据清洗、数据合成和数据标注关键操作，旨在确保原始数据符合业务需求和模型训练的标准，是数据工程中的核心环节。数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 NLP大模型支持接入的数据集类型盘古NLP大模型仅支持接入文本类数据集，数据集文件内容包括：预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
标注图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集创建图片类数据集标注任务标注图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建图片类数据集标注任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 NLP大模型训练流程介绍 NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型

总条数： 134

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线