搜索_华为云

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

"你好，请介绍自己","哈哈，你好呀，我是你的聪明助手。" 单个文件大小不超过50GB，文件数量最多1000个。。多轮问答 jsonl jsonl格式：数组格式，至少由一组问答对构成。形式为[{"context":"context内容1","target":"target内容1"},{"context":"context内容2"

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

提高勘探和开发效率。进行岩性识别，例如对不同岩石类型进行分类，帮助识别岩石的性质和特征，指导钻井和开采。进行流体识别，例如根据测井数据，识别储层中的油、气、水等流体类型。 2024年12月发布的版本，支持分析历史数据中的特征与类别的关系，学习出一种映射规则或函数，然后应用这个规则对未来未知的数据点进行分类。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
数据工程介绍 - 盘古大模型 PanguLargeModels

时序 csv 回归分类 csv 其他类用户自定义支持构建CV场景中包含图片和标注文件的图像分类数据集，如图片+CV标注、视频+CV标注等类型。各类数据支持的操作各类型数据支持的数据工程操作见表2。表2 各类数据支持的操作数据类型数据获取数据清洗数据合成数据标注数据评估

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

而提高模型的整体效果，详见表1。表1 CV大模型的类型模型名称适用场景说明 Pangu-CV-ObjectDetection-N-2.1.0 该模型属于物体检测模型，旨在识别图像中的所有感兴趣目标，定位其位置并确定其类别。适用于各种任务，如：积水检测、占道经营检测、人员离岗检测、动植物检测、工业缺陷检测等。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

训练参数说明训练配置模型来源选择“盘古大模型”。模型类型选择“CV大模型”。训练类型选择“微调”。基础模型选择所需微调的基础模型。训练参数数据集训练数据集。自定义L1预训练模型目录自定义预训练模型所在的OBS路径。训练轮数表示完成全部训练数据集训

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
发布气象类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“气象 > 气象数据”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前气象类数据集仅支持发布默认格式。填写数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据工程使用流程 - 盘古大模型 PanguLargeModels

的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。数据工程操作流程见图1、表1。图1 数据集构建流程图表1 数据集构建流程表流程子流程说明导入数据至盘古平台创建导入任务将存储在OBS服务中的数据导入至平台统一管理，用于后续加工或发布操作。加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
工作流 - 盘古大模型 PanguLargeModels

要配置鉴权信息等，具体结构定义详见表4。表4 PluginConfig参数参数是否必选参数类型描述 plugin_id 是 String 插件Id，获取方式如下：在“Agent开发”页面，左侧导航栏选择“工作台 > 插件”，在所需插件中单击“ > 复制ID”。 plugin_configs

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent开发
插件介绍 - 盘古大模型 PanguLargeModels

果。此插件为Agent提供了强大的计算、数据处理和分析功能，用户只需将其添加到应用中，即可扩展功能。自定义插件：为了满足更个性化的需求，平台允许开发者创建自定义插件，支持将API通过配置方式快速创建为插件，并供Agent调用。这样，开发者可以根据特定需求为应用增加专属功能。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
发布预测类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“预测 > 时序”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前预测类数据集仅支持发布默认格式。填写数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

特殊空格：[\u2000-\u2009] 自定义正则过滤删除符合自定义正则表达式的数据。自定义关键词过滤剔除包含关键词的数据。敏感词过滤对文本中涉及黄色、暴力、政治等敏感数据进行自动检测和过滤。文本长度过滤按照设置的文本长度，保留长度范围内的数据进行。冗余信息过滤按照段落粒度，删除文本中的冗余信息，不改变数据条目。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

训练配置模型来源选择“盘古大模型”。模型类型选择“预测大模型”。训练类型选择“微调”。基础模型选择所需微调的基础模型。训练参数数据集训练数据集。类别特征列指定使用LabelEncoder处理的字符串类型类别特征的列表。格式为["列名1","列名2"]，默

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

NLP大模型支持接入的数据集类型盘古NLP大模型仅支持接入文本类数据集，数据集文件内容包括：预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1 训练NLP大模型数据集类型要求基模型训练场景

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
应用介绍 - 盘古大模型 PanguLargeModels

应用介绍在Agent开发平台上，用户可以构建两种类型的应用：知识型Agent：以大模型为任务执行核心，适用于文本生成和文本检索任务，如搜索问答助手、代码生成助手等。用户通过配置Prompt、知识库等信息，使得大模型能够自主规划和调用工具。优点：零代码开发，对话过程智能化。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

顺序排列。列：每列表示一种特征。每列的数据类型应保持一致，不同列可以具有不同的数据类型。顺序：表格中的行通常按照特定顺序排列。行数：数据表的行数应大于5000行。维度：数据的维度（列数）应大于10维。数据完整性：必须确保数据中没有缺失值。构建预测大模型数据集流程在ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
创建插件 - 盘古大模型 PanguLargeModels

依据。参数描述参数的描述，长度为1 ~ 200个字符，参数描述会作为大模型解析参数含义的依据。参数类型该参数值的数据类型，当前支持三种类型。 String：字符串类型 Integer：四字节整型 Number：八字节浮点数请求方式默认以Body方式请求。是否必填指定该参数是否为必填项。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

的每个像素值对应原图中像素的类别，且每个类别的值需连续且从0开始，表示不同的物体或区域类别。例如，假设有一张原图为IMG_20180919_114732.jpg，对应的标注图为IMG_20180919_114732.png，其中标注图的不同像素值代表不同的类别，标注图的每个像素值

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

支持数据发布的数据集类型见表1。表1 支持数据发布的数据集类型数据类型数据评估数据配比数据流通文本类 √ √ √ 图片类 √ √ √ 视频类 √ - √ 气象类 - - √ 预测类 - - √ 其他类 - - √ ModelArts Studio大模型开发平台支持将文本类、图片类数据集发布为两种格式：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

接口的响应体需要按照jsonpath语法要求进行填写，jsonpath语法的作用是从响应体的json字段中提取出所需的数据。评测配置评测类型选择“人工评测”。评测指标由用户自定义评测指标并填写评测标准。评测数据集待评测的数据集。评测结果存储位置模型评测结果的存储位置。基本信息评测任务名称

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

平台支持用户自定义创建工作空间，并进行空间的统一管理。导入数据至盘古平台创建导入任务将存储在OBS服务中的数据导入至平台统一管理，用于后续加工或发布操作。加工数据集清洗数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南

总条数： 151

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

发布气象类数据集 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

工作流 - 盘古大模型 PanguLargeModels

插件介绍 - 盘古大模型 PanguLargeModels

发布预测类数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

应用介绍 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线