搜索_华为云

发布图片类数据集 - 盘古大模型 PanguLargeModels

“默认格式”为数据工程功能支持的原始格式。 “盘古格式”为使用盘古大模型训练或评测时所需要使用的数据格式。 “自定义格式”可以通过自定义格式转换脚本，将数据集转化为适用于其他模型的格式。例如盘古数据集中，context、target字段分别表示问题和答案。对于Alpaca格式的数据集，inst

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化json数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
获取图片类数据集评估报告 - 盘古大模型 PanguLargeModels

Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程 > 数据评估 > 评估任务”。单击操作列“报告”可以查看详细的质量评估报告。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估图片类数据集
获取文本类数据集评估报告 - 盘古大模型 PanguLargeModels

Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程 > 数据评估 > 评估任务”。单击操作列“报告”可以查看详细的质量评估报告。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估文本类数据集
获取视频类数据集评估报告 - 盘古大模型 PanguLargeModels

Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程 > 数据评估 > 评估任务”。单击操作列“报告”可以查看详细的质量评估报告。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估视频类数据集
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。首先，需要根据业务需求收集相关的原始数据，确保数据的覆盖面和多样性。例如

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建视频类数据集加工任务 - 盘古大模型 PanguLargeModels

在“创建加工数据集”页面，选择需要加工的视频类数据集，并设置数据集的名称和描述信息。选择数据集时，默认选择当前空间的数据集。如果用户具备其他空间的访问权限，可以选择来自其他空间的数据集。图3 创建加工数据集单击“下一步”进入“算子编排”页面。对于视频类数据集，可选择的加工算子及参数配置请参见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工视频类数据集
创建气象类数据集加工任务 - 盘古大模型 PanguLargeModels

在“创建加工数据集”页面，选择需要加工的气象类数据集，并设置数据集的名称和描述信息。选择数据集时，默认选择当前空间的数据集。如果用户具备其他空间的访问权限，可以选择来自其他空间的数据集。图3 创建加工数据集单击“下一步”进入“算子编排”页面。对于气象类数据集，可选择的加工算子及参数配置请参见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工气象类数据集
创建图片类数据集加工任务 - 盘古大模型 PanguLargeModels

在“创建加工数据集”页面，选择需要加工的图片类数据集，并设置数据集的名称和描述信息。选择数据集时，默认选择当前空间的数据集。如果用户具备其他空间的访问权限，可以选择来自其他空间的数据集。图3 创建加工数据集单击“下一步”进入“算子编排”页面。对于图片类数据集，可选择的加工算子及参数配置请参见表1、表2。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工图片类数据集
创建文本类数据集加工任务 - 盘古大模型 PanguLargeModels

数据加工”，单击界面右上角“创建加工数据集”。图2 数据加工在“创建加工数据集”页面，选择需要加工的文本类数据集，并设置数据集的名称和描述。选择数据集时，默认选择当前空间的数据集。如果用户具备其他空间的访问权限，可以选择来自其他空间的数据集。图3 创建加工数据集单击“下一步”进入“算子编排”页面。对于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 加工文本类数据集
创建文本类数据集标注任务 - 盘古大模型 PanguLargeModels

> 标注管理”，单击页面右上角“创建标注任务”。图2 标注管理在“创建标注任务”页面选择需要标注的加工后的文本类数据集，并设置标注项。设置标注项时，不同类型的数据文件对应的标注项也有所差异，可基于页面提示进行设置。图3 创建标注任务单击“下一步”设置标注人员及信息，单击“完成创建”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集 > 标注文本类数据集
发布其他类数据集 - 盘古大模型 PanguLargeModels

在“创建发布数据集”页面，选择“其他”类型的数据集，当前可选“自定义”类型的数据。图2 创建其他类数据集发布任务当前其他类数据集仅支持发布默认格式，选择好数据集的发布格式后，单击“下一步”。设置数据集的“资产可见性”，填写数据集名称、描述，设置扩展信息后，单击“确认发布”进行数据集发布操作。发布后的数据集支持重新发布和删除操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
发布视频类数据集 - 盘古大模型 PanguLargeModels

当前视频类数据集仅支持发布默认格式，选择好数据集的发布格式后，单击“下一步”。设置数据集的“资产可见性”，填写数据集名称、描述，设置扩展信息后，单击“确认发布”进行数据集发布操作。发布后的数据集支持重新发布和删除操作。发布后的数据集会作为当前空间的数据资产同步显示在“空间资产 > 数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
发布气象类数据集 - 盘古大模型 PanguLargeModels

在“创建发布数据集”页面，选择“气象”类型的数据集，当前可选“海洋气象”类型的数据。图2 创建气象类数据集发布任务当前气象类数据集仅支持发布默认格式，选择好数据集的发布格式后，单击“下一步”。设置数据集的“资产可见性”，填写数据集名称、描述，设置扩展信息后，单击“确认发布”进行数据集发布操作。发布后的数据集支持重新发布和删除操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
使用推理SDK - 盘古大模型 PanguLargeModels

Explorer可根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。您可以在API Explorer中具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码。图1 获取SDK代码示例当您在中间填充栏填入对应内容时，右侧代码示例会自动完成参数的组装。图2 设置输入参数填写输入

 帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
发布预测类数据集 - 盘古大模型 PanguLargeModels

在“创建发布数据集”页面，选择“预测”类型的数据集。并根据训练任务场景选择“时序”、“回归分类”类型的数据。图2 创建预测类数据集发布任务当前预测类数据集仅支持发布默认格式，选择好数据集的发布格式后，单击“下一步”。设置数据集的“资产可见性”，填写数据集名称、描述，设置扩

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
大模型开发基本概念 - 盘古大模型 PanguLargeModels

多样性和一致性是评估LLM生成语言的两个重要方面。多样性指模型生成的不同输出之间的差异。一致性指相同输入对应的不同输出之间的一致性。重复惩罚重复惩罚（repetition_penalty）是在模型训练或生成过程中加入的惩罚项，旨在减少重复生成的可能性。通过在计算损失函数（用于优化模型的指标）时增加

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建图片类数据集评估任务 - 盘古大模型 PanguLargeModels

评估任务”，单击界面右上角“创建评估任务”。图2 创建评估任务在“数据集选择”页签选择需要进行评估的加工数据集，并设置抽样规格，即从数据集中抽取一定比例数据用于评估。图3 选择数据集单击“下一步”选择需要使用的评估标准。标准选择完成后，单击“下一步”设置评估人员。图4 选择评估标注图5 选择评估人员

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估图片类数据集
创建视频类数据集评估任务 - 盘古大模型 PanguLargeModels

评估任务”，单击界面右上角“创建评估任务”。图2 创建评估任务在“数据集选择”页签选择需要进行评估的加工数据集，并设置抽样规格，即从数据集中抽取一定比例数据用于评估。图3 选择数据集单击“下一步”选择需要使用的评估标准。标准选择完成后，单击“下一步”设置评估人员。图4 选择评估标注图5 选择评估人员

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估视频类数据集
图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍

总条数： 168

上一页
1
...
4
5
6
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布图片类数据集 - 盘古大模型 PanguLargeModels

气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

获取图片类数据集评估报告 - 盘古大模型 PanguLargeModels

获取文本类数据集评估报告 - 盘古大模型 PanguLargeModels

获取视频类数据集评估报告 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

创建视频类数据集加工任务 - 盘古大模型 PanguLargeModels

创建气象类数据集加工任务 - 盘古大模型 PanguLargeModels

创建图片类数据集加工任务 - 盘古大模型 PanguLargeModels

创建文本类数据集加工任务 - 盘古大模型 PanguLargeModels

创建文本类数据集标注任务 - 盘古大模型 PanguLargeModels

发布其他类数据集 - 盘古大模型 PanguLargeModels

发布视频类数据集 - 盘古大模型 PanguLargeModels

发布气象类数据集 - 盘古大模型 PanguLargeModels

使用推理SDK - 盘古大模型 PanguLargeModels

发布预测类数据集 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

创建图片类数据集评估任务 - 盘古大模型 PanguLargeModels

创建视频类数据集评估任务 - 盘古大模型 PanguLargeModels

图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线