搜索_华为云

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类算子名称算子描述数据提取图文提取提取图文压缩包中的JSON文本和图片，并对图片进行结构化解析（BASE64编码）。数据过滤图片元数据过滤基于图片存储大小、宽高比属性进行图片/图文数据清洗。图文文本长度过滤

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

基于大模型的数据泛化：您可以通过调用大模型（比如盘古提供的任意一个规格的基础功能模型）来获取有监督场景。一个比较常见的方法是，将无监督的文本按照章节、段落、字符数进行切片，让模型基于这个片段生成问答对，再将段落、问题和答案三者组装为有监督数据。使用模型构建的优点是数据丰富度更高，缺点是成本较高。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
权限管理 - 盘古大模型 PanguLargeModels

组，并对用户组授权，才能使得用户组中的用户获得对应的权限。授权后，用户就可以基于被授予的权限对云服务进行操作。服务使用OBS存储训练数据和评估数据，如果需要对OBS的访问权限进行细粒度的控制。可以在盘古服务的委托中增加Pangu OBSWriteOnly、Pangu OBSRe

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

WORD内容提取从Word文档中提取文字，并保留原文档的目录、标题和正文等结构，不保留图片、表格、公式、页眉、页脚。 TXT内容提取从TXT文件中提取所有文本内容。 CSV内容提取从CSV文件中读取所有文本内容，并按该文件内容类型模板KEY值生成匹配的JSON格式数据。 PDF内容提取

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

x',// 数据集版本信息。 'classes': [category1',category2', ...],// 所有类别名称的列表，每个类别对应一个 label，用于标注视频中的事件或动作。 'database': { 'video_name':{

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
创建CV大模型部署任务 - 盘古大模型 PanguLargeModels

部署参数参数说明部署配置模型来源选择“盘古大模型”。模型类型选择“CV大模型”。部署模型选择需要进行部署的模型。部署方式选择“云上部署”。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安全护栏基础版，内置了默认的内容审核规则。资源配置计费模式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 部署CV大模型
创建NLP大模型部署任务 - 盘古大模型 PanguLargeModels

模型来源选择“盘古大模型”。模型类型选择“NLP大模型”。部署模型选择需要进行部署的模型。部署方式选择“云上部署”。最大TOKEN长度模型可最大请求的上下文TOKEN数。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安全护栏基础版，内置了默认的内容审核规则。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 部署NLP大模型
创建预测大模型部署任务 - 盘古大模型 PanguLargeModels

部署参数参数说明部署配置模型来源选择“盘古大模型”。模型类型选择“预测大模型”。部署模型选择需要进行部署的模型。部署方式选择“云上部署”。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安全护栏基础版，内置了默认的内容审核规则。资源配置计费模式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 部署预测大模型
应用场景 - 盘古大模型 PanguLargeModels

化的客户需求；个性化服务：基于大模型的智能客服能够学习和适应用户的行为模式和偏好，提供更加个性化的服务。农业科学计算大模型包括全球中期天气要素模型和降水模型，可以对未来一段时间的天气和降水进行预测，全球中期天气要素模型和降水模型能够在全球范围内进行预测，不仅仅局限于某个地区。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
流通视频类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“视频 > 仅视频”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前视频类数据集仅支持发布默认格式。填写数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

接口的响应体需要按照jsonpath语法要求进行填写，jsonpath语法的作用是从响应体的json字段中提取出所需的数据。评测配置评测类型选择“自动评测”。评测规则选择“基于规则”。评测数据集评测模板：使用预置的专业数据集进行评测。单个评测集：由用户指定评测指标（

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
标注文本类数据集 - 盘古大模型 PanguLargeModels

在“创建标注任务”页面选择需要标注的文本类数据集，并选择标注项。选择标注项时，不同类型的数据文件对应的标注项有所差异，可基于页面提示进行选择。单击“下一步”，可查看效果预览。单击“下一步”，参考表1配置标注分配与审核。表1 标注分配与审核配置参数类型参数名称参数说明标注分配启用多人标注关闭时，默认管理员单人标注。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
管理盘古数据资产 - 盘古大模型 PanguLargeModels

如果状态为“订阅失败”，表示该资产未成功从AI Gallery订阅，可单击“重新订阅”重新从AI Gallery订阅数据资产。订阅成功后的数据资产，将在“数据工程 > 数据获取 > 原始数据集”中显示，可执行后续的数据加工及发布操作。管理数据资产登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
流通图片类数据集 - 盘古大模型 PanguLargeModels

> 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“图片 > 图片+Caption”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。由于数据工程需要支持对接盘古大模型，为了使这些

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
状态码 - 盘古大模型 PanguLargeModels

状态码 HTTP状态码为三位数，分成五个类别：1xx：相关信息；2xx：操作成功；3xx：重定向；4xx：客户端错误；5xx：服务器错误。状态码如下所示。状态码编码状态说明 100 Continue 继续请求。这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
标注视频类数据集 - 盘古大模型 PanguLargeModels

类。如图1，在视频中标注场景主题类别。每个视频片段只对应一个分类标签，分类项不再进一步细分或包含更多的层次结构。图1 单层级分类示例-视频主题分类多层级分类：多层级分类允许对同一视频内容进行更复杂的分类，并通过层次结构展现。通常会先从一个大类别开始，然后逐渐向下细分，直到达到

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
评估视频类数据集 - 盘古大模型 PanguLargeModels

在“人工评估标准”页面，单击“创建标准”，选择预置标准作为参考项，并填写“评估标准名称”和“描述”。单击“下一步”，编辑评估项。用户可以基于实际需求删减评估项，或创建自定义评估项。创建自定义评估项时，需要将评估类别、评估项、评估项说明填写清晰，填写时确保描述无歧义。单击“完成创建”以创建评估标准。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
标注图片类数据集 - 盘古大模型 PanguLargeModels

人员参考，以提高标注效率。单击“下一步”，可查看效果预览。单击“下一步”，参考表1配置标注分配与审核。表1 标注分配与审核配置参数类型参数名称参数说明标注分配启用多人标注关闭时，默认管理员单人标注。启用时，可以指定参与标注的人员及标注数量。标注要求选择标注

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
评估文本类数据集 - 盘古大模型 PanguLargeModels

在“人工评估标准”页面，单击“创建标准”，选择预置标准作为参考项，并填写“评估标准名称”和“描述”。单击“下一步”，编辑评估项。用户可以基于实际需求删减评估项，或创建自定义评估项。创建自定义评估项时，需要将评估类别、评估项、评估项说明填写清晰，填写时确保描述无歧义。单击“完成创建”以创建评估标准。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

在“人工评估标准”页面，单击“创建标准”，选择预置标准作为参考项，并填写“评估标准名称”和“描述”。单击“下一步”，编辑评估项。用户可以基于实际需求删减评估项，或创建自定义评估项。创建自定义评估项时，需要将评估类别、评估项、评估项说明填写清晰，填写时确保描述无歧义。单击“完成创建”以创建评估标准。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集

总条数： 121

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

创建CV大模型部署任务 - 盘古大模型 PanguLargeModels

创建NLP大模型部署任务 - 盘古大模型 PanguLargeModels

创建预测大模型部署任务 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

流通视频类数据集 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

标注文本类数据集 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

评估视频类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

评估文本类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线