搜索_华为云

配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
流通图片类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个图片类数据集支持发布的格式为：默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。创建文本类数据集流通任务步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

评估标准创建完成后可以在“人工评估标准”页面查看创建的评估标准，并支持编辑与删除操作。创建图片类数据集评估任务平台仅支持对“加工数据集”执行评估操作。创建图片类数据集评估任务前，请参考加工图片类数据集，生成一个“加工数据集”。创建图片类数据集评估任务步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集清洗图片类数据集标注图片类数据集父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
标注图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集创建图片类数据集标注任务标注图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建图片类数据集标注任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
清洗图片类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集清洗图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建图片类数据集清洗任务创建图片类数据集清洗任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集评估图片类数据集配比图片类数据集流通图片类数据集父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，before文件夹：包含变化前的图片，每幅图片需与变化后的图片同名、同尺寸。 after文件夹：包含变化后的图片，每幅图片需与变化前的图片同名、同尺寸。 label文件夹：包含与变化前和变化后图片同名、同尺寸的PNG文件。每个像素值代表该位置对应的类别信息，类别应是连续的且从0开始。视频分类图片导入

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。图片去重通过把图片结构化处理后，过滤重复的图片/图文对数据。数据打标图片鉴黄评分对图片的涉黄程度进行评分，分数越高越危险。默认评分不小于50分的视频可视为涉黄视频。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳提示词与训练数据的相似度关系。提示词的效果通常与训练数据的相似度密切相关。当提示词的内容与模型在训练过程中接触过的样本数据相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

精度。标注图片类数据集、标注视频类数据集发布图片、视频类数据集评估图片、视频类数据集平台预置了多种数据类型的基础评估标准，包括NLP、视频和图片数据，用户可根据需求选择预置标准或自定义评估标准，从而精确优化数据质量，确保数据满足高标准，提升模型性能。评估图片类数据集、评估视频类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
数据工程 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，支持的数据类型包括文本、图片、视频、气象、预测数据以及用户自定义的其他类型数据。平台提供灵活的数据接入方式以及支持多种文件格式导入，确保不同业务场景下的数据获取需求得到满足。数据清洗：平台提供强大的数据清洗功能，可以对文本、视频、图片、气象类型的数据进行数据提取、过滤

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程介绍 - 盘古大模型 PanguLargeModels

jsonl、csv 图片类仅图片 jpg、jpeg、png、bmp、tar包图片+Caption 图片格式支持：jpg、jpeg、png、bmp，所有图片需保存为tar包。 Caption格式支持：jsonl 图片+QA对图片格式支持：jpg、jpeg、png、bmp，所有图片需保存为tar包。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

ROUGE-1 模型生成句子与实际句子在单个词的相似度，数值越高，表明模型性能越好。 ROUGE-2 模型生成句子与实际句子在两个词的相似度，数值越高，表明模型性能越好。 ROUGE-L 模型生成句子与实际句子在最长公共子序列的相似度，数值越高，表明模型性能越好。 PRECISION

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建知识库 - 盘古大模型 PanguLargeModels

上传本地文件。知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。知识库命中测试步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
明确任务需求 - 盘古大模型 PanguLargeModels

识。例如，在构造泛化问题的任务中，需要基于原问题改写为相同含义的问题，而不是生成相似的问题。当提示词使用“请生成10个跟“手机银行怎么转账”相似的问题”时，模型会认为实体/关键词/场景一致则是相似（在这个例子里实体为手机银行），而不是任务需要的语义级别的相同含义，所以输出内容会发散。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单算子分类算子名称算子描述数据提取 WORD内容提取从Word文档中提取文字，并保留原文档的目录、标题和正文等结构，不保留图片、表格、公式、页眉、页脚。 TXT内容提取从TXT文件中提取所有文本内容。 CSV内容提取从CSV文件中读取所有文本内容，并按该文件内

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
创建插件 - 盘古大模型 PanguLargeModels

Agent开发平台。单击左侧导航栏“工作台”，在“插件”页签，单击右上角“创建插件”。在“创建插件”页面，填写插件名称与插件描述，单击图片可上传插件图标，单击“下一步”。在“配置信息”页面，参照表1完成信息配置。表1 插件信息配置说明参数名称参数说明插件URL 插件服务的请求URL地址。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作，不支持数据加工操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求

总条数： 168

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配比图片类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

明确任务需求 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线