搜索_华为云

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

html 数据集最大100万个文件，单文件最大10GB，整个数据集最大10TB。预训练文本 jsonl jsonl格式：text表示预训练所使用的文本数据，具体格式示例如下： {"text":"盘古大模型，是华为推出盘古系列AI大模型，包括NLP大模型、多模态大模型、CV大模型、科学计算大模型、预测大模型。"}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集，创建时支持导入mp4或avi格式文件，同一文件夹下mp4或avi格式的所有视频文件会被同时上传导入，具体格式要求详见表1。表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 ModelArts Studio大模型开发平台支持导入气象类数据集，该数据集当前包括海洋气象数据。海洋气象数据通常来源于气象再分析。气象再分析是通过现代气象模型和数据同化技术，重新处理历史观测数据，生成高质量的气象记录。这些数据既可以覆盖全球范围，也可以针

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求平台支持创建预测类数据集，创建时可导入时序数据、回归分类数据。时序数据：时序预测数据是一种按时间顺序排列的数据序列，每个数据点都有一个时间戳，表示数据在时间上的位置。它用于预测未来事件或趋势，过去的数据会影响未来的预测。回归分类数据：回归分类数据包含多种

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

云上部署：算法部署至平台提供的资源池中。边缘部署：算法部署至客户的边缘设备中。作业输入方式选择 “OBS”表示从OBS中读取数据。作业输出方式选择 “OBS”表示将输出结果存储在OBS中。作业配置参数设置模型部署参数信息，平台已给出默认值。架构类型算法所支持的结构类型，模型选择完成后，会自动适配架构类型。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 部署科学计算大模型
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 ModelArts Studio大模型开发平台支持创建图片类数据集，创建时可导入图片、图片+Caption、图片+QA对三种类型的数据，具体格式要求详见表1。表1 图片类数据集格式要求文件内容文件格式文件要求图片 tar、图片目录图片：支持jpg

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

{"9.": "⑨|⑼|㊈|⒐|⓽|➒|❾|➈"} {"10.": "⑩|⑽|㊉|⒑|⓾|➓|❿|➉"} 自定义正则替换数据条目不变下，使用自定义正则表达式替换文本内容。示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
创建视频类数据集评估标准 - 盘古大模型 PanguLargeModels

Studio大模型开发平台针对视频数据集预设了一套评估标准，涵盖了视频的清晰度、帧率、完整性、标签准确性等多个质量维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建视频类数据集评估任务。创建视频类数据集评估标准步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估视频类数据集
视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

视频类加工算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的加工操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

气象类加工算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
创建文本类数据集评估标准 - 盘古大模型 PanguLargeModels

Studio大模型开发平台针对文本数据集预设了一套基础评估标准，涵盖了数据准确性、完整性、一致性、格式规范等多个维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建文本类数据集评估任务。创建文本类数据集评估标准步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估文本类数据集
查询推理作业详情 - 盘古大模型 PanguLargeModels

type String 存储类型。 data Array of ObsStorageDto objects 输入数据的OBS信息。表4 ObsStorageDto 参数参数类型描述 bucket String 输入数据的OBS桶名称。 path String 初始场数据的存放路径。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 海洋模型
创建视频类数据集加工任务 - 盘古大模型 PanguLargeModels

算子编排过程中，可以单击右上角“保存为新模板”将当前算子编排流程保存为模板，后续创建新的数据加工任务时，可以直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的加工步骤。图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工视频类数据集
创建气象类数据集加工任务 - 盘古大模型 PanguLargeModels

算子编排过程中，可以单击右上角“保存为新模板”将当前算子编排流程保存为模板，后续创建新的数据加工任务时，可以直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的加工步骤。图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工气象类数据集
创建视频类数据集评估任务 - 盘古大模型 PanguLargeModels

在“数据集选择”页签选择需要进行评估的加工数据集，并设置抽样规格，即从数据集中抽取一定比例数据用于评估。图3 选择数据集单击“下一步”选择需要使用的评估标准。标准选择完成后，单击“下一步”设置评估人员。图4 选择评估标注图5 选择评估人员评估人员设置完成后，单击“下一步”填写任

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估视频类数据集
创建视频类数据集标注任务 - 盘古大模型 PanguLargeModels

指定参与标注的人员。对于使用AI进行预标注的视频Caption任务可设置以下两种方式的“标注要求”：选择“全部标注”：要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。选择“可部分标注”：允许标注人员在确认AI预标注满足要求后，直接使用AI预标注功能完成数据集的标注并提交标注结果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集 > 标注视频类数据集
创建文本类数据集加工任务 - 盘古大模型 PanguLargeModels

算子编排过程中，可以单击右上角“保存为新模板”将当前算子编排流程保存为模板，后续创建新的数据加工任务时，可以直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的加工步骤。图4 算子编排图5 选择加工模板算子编排完成后，单击“立即执行”，平台会直接启动数据加工

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工文本类数据集
查询推理作业详情 - 盘古大模型 PanguLargeModels

type String 存储类型。 data Array of ObsStorageDto objects 输入数据的OBS信息。表4 ObsStorageDto 参数参数类型描述 bucket String 输入数据的OBS桶名称。 path String 初始场数据的存放路径。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 气象/降水模型
创建文本类数据集评估任务 - 盘古大模型 PanguLargeModels

在“数据集选择”页签选择需要进行评估的加工数据集，并设置抽样规格，即从数据集中抽取一定比例数据用于评估。图3 选择数据集单击“下一步”选择需要使用的评估标准。标准选择完成后，单击“下一步”设置评估人员。图4 选择评估标注图5 选择评估人员评估人员设置完成后，单击“下一步”填写任

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估文本类数据集
获取文本类数据集评估报告 - 盘古大模型 PanguLargeModels

获取文本类数据集评估报告 ModelArts Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估文本类数据集

总条数： 233

上一页
1
...
6
7
8
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

创建视频类数据集评估标准 - 盘古大模型 PanguLargeModels

视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

创建文本类数据集评估标准 - 盘古大模型 PanguLargeModels

查询推理作业详情 - 盘古大模型 PanguLargeModels

创建视频类数据集加工任务 - 盘古大模型 PanguLargeModels

创建气象类数据集加工任务 - 盘古大模型 PanguLargeModels

创建视频类数据集评估任务 - 盘古大模型 PanguLargeModels

创建视频类数据集标注任务 - 盘古大模型 PanguLargeModels

创建文本类数据集加工任务 - 盘古大模型 PanguLargeModels

查询推理作业详情 - 盘古大模型 PanguLargeModels

创建文本类数据集评估任务 - 盘古大模型 PanguLargeModels

获取文本类数据集评估报告 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线