搜索_华为云

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。数据合成利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
Agent开发 - 盘古大模型 PanguLargeModels

具集，帮助您高效地开发、优化和部署应用智能体。无论您是新手还是有经验的开发者，都能通过平台提供的提示词工程、插件扩展、灵活的工作流设计和全链路调测功能，快速实现智能体应用的开发与落地，加速行业AI应用的创新与应用。对于零码开发者（无代码开发经验的用户）：平台提供了Prompt

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

行自动检测和过滤。文本长度过滤按照设置的文本长度，保留长度范围内的数据进行。冗余信息过滤按照段落粒度，删除文本中的冗余信息，不改变数据条目。例如目录封面、图注表注、标注说明、尾部信息、冗余段落和参考文献等。 N-gram特征过滤用于判断文档重复度，根据特征N值计算文档

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据工程 - 盘古大模型 PanguLargeModels

为专门用于训练盘古大模型的盘古格式，为后续模型训练提供高效的数据支持。数据管理：平台支持数据全链路血缘追溯，用户单击数据集名称可以在“数据血缘”页签，查看该数据集所经历的操作。全链路血缘追溯可以帮助用户正向实现数据集影响分析，逆向实现快速问题追踪，提升数据运维和数据治理的效率，

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程使用流程 - 盘古大模型 PanguLargeModels

加工数据集清洗数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。合成数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
Agent开发平台介绍 - 盘古大模型 PanguLargeModels

通过“拖拉拽”的方式快速搭建一个工作流。 Agent开发平台功能及优势 Agent开发平台具有能力扩展、自定义知识库、灵活的工作流设计和全链路信息调测评估等特点。能力扩展：平台可以集成多种插件，插件能够有效扩展Agent的能力边界。预置插件：平台当前为用户提供了“Python

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

发、应用开发三大工具链，帮助开发者充分利用盘古大模型的功能。通过该平台，企业可根据需求选择合适的盘古NLP大模型、CV大模型、预测大模型、科学计算大模型、专业大模型等服务，便捷地构建自己的模型和应用。数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

清洗文本类数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。清洗文本类数据集合成文本类数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

"right_shoulder", "left_elbow", "right_elbow", "left_wrist", "right_wrist"

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

清洗气象类数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。清洗气象类数据集发布气象类数据集流通气象类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”，用于后续模型训练等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

清洗图片、视频类数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。清洗图片类数据集、清洗视频类数据集标注图片、视频类数据集为无标签数据集添加准确的标签，确保模型训练所需的高质量

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

LabelEncoder的作用是将类别特征转换为数值型特征，使模型能够处理这些特征。非特征列列出不需要输入到模型中的特征列，用于排除冗余或无意义的特征。格式为["列名1","列名2"]，默认设置为[]，表示所有特征都用于训练。标准化列指定需要进行最大最小值标准化处理的数值特征的列表。格式为["列名1"

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型

总条数： 12

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

Agent开发 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

Agent开发平台介绍 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线