搜索_华为云

导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传当前，ModelArts Studio平台针对不同类别的数据集可使用OBS服务导入的文件形式不同：文本、视频、预测和其他类（自定义）数据集支持文件夹或单个文件导入，导入界面提示用户：“请选择文件夹或文件”。图1 支持导入单个文件示例图片、视频（事

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集加工图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建图片类数据集加工任务创建图片类数据集加工任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
图片类加工算子介绍 - 盘古大模型 PanguLargeModels

通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。图片去重通过把图片结构化处理后，过滤重复的图片/图文对数据。数据打标图片鉴黄评分对图片的涉黄程度

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集加工图片类数据集标注图片类数据集配比图片类数据集父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
标注图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集创建图片类数据集标注任务标注图片类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。数据标注功能支持创建标注任务、标注数据集（标注作业）、审核标注后的数据集（审核作业）与管理标注任务（任务管理）。其中，不同角色权限支持的功能及展示的前端界面略有差异，详见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至发布图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，before文件夹：包含变化前的图片，每幅图片需与变化后的图片同名、同尺寸。 after文件夹：包含变化后的图片，每幅图片需与变化前的图片同名、同尺寸。 label文件夹：包含与变化前和变化后图片同名、同尺寸的PNG文件。每个像素值代表该位置对应的类别信息，类别应是连续的且从0开始。视频分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
评估图片类数据集 - 盘古大模型 PanguLargeModels

评估标准创建完成后可以在“人工评估标准”页面查看创建的评估标准，并支持编辑与删除操作。创建图片类数据集评估任务平台仅支持对“加工数据集”执行评估操作。创建图片类数据集评估任务前，请参考加工图片类数据集，生成一个“加工数据集”。创建图片类数据集评估任务步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
文本类加工算子介绍 - 盘古大模型 PanguLargeModels

按照句子的过滤粒度，自动识别段落结尾处的内容是否完整，如果不完整，则过滤。广告数据过滤按照句子的过滤粒度，删除文本中包含广告数据的句子。 QA对过滤过滤包含以下情况的QA对：问题不是string格式。回答为空。回答无意义。语种过滤通过语种识别模型得到文档的语言类型，筛选所需语种的文档。全局文本去重

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集数据发布是将数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。图片类数据集支持发布的格式为：标准格式：如图1，平台默认的格式。该格式的数据集可发布到资产中，但下游模型开发不可见。图1 图片类数据集标准格式示例盘古格式：如图2，训练盘古大

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集评估图片类数据集发布图片类数据集父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
视频类加工算子介绍 - 盘古大模型 PanguLargeModels

识别视频中是否包含水印。字幕识别识别视频中是否包含字幕。 Logo识别识别视频中是否包含Logo。视频黑边识别识别视频中是否包含黑边。密集文字识别识别视频中是否包含密集文字，达到密集文字面积占比的视频则为含密集文字视频，一般裁剪面积占比≥7%为密集文字视频。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类
创建知识库 - 盘古大模型 PanguLargeModels

上传完成后，单击“确定”，完成知识库的创建。知识库创建完成后，如果想在当前知识库中继续上传文件，可单击该知识库进入详情页面，再单击右上角“继续上传”，上传本地文件。知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
创建并管理盘古工作空间 - 盘古大模型 PanguLargeModels

创建并管理盘古工作空间创建盘古工作空间创建盘古工作空间步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”分页，单击“创建空间”。填写空间名称、描述，单击“确认”，完成空间的创建。图1 创建空间单击创建好的空间，进入ModelArts Studio大模型开发平台。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作 > 创建并管理盘古工作空间
数据工程 - 盘古大模型 PanguLargeModels

场景下的数据获取需求得到满足。数据加工：平台提供强大的数据加工功能，可以对文本、视频、图片、气象类型的数据进行数据提取、过滤、转换、打标签和评分等加工处理。针对不同类型的数据集，平台提供了专用的清洗算子以及支持用户创建自定义算子实现个性化的数据清洗诉求。确保生成高质量的训练数据

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程介绍 - 盘古大模型 PanguLargeModels

数据合成：数据合成利用预置或自定义的数据指令对原始数据集进行处理，并根据设定的轮数生成新的数据。数据标注：数据标注旨在为无标签的数据集添加准确的标签，标注数据的质量直接影响模型的训练效果和精度。针对不同数据集平台支持人工标注与AI预标注两种形式。其中，图片Caption、视频Caption标注项支持AI预标注功能。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的最大利润和市值是多少？科技行业公司的最小利润和市值是多少？科技行业公司的中位利润和市值是多少？科技行业公司的总利润和市值是多少？ … 来源四：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，再基于大模型（比如盘古提供的任意一个规格的基础功能模

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
创建插件 - 盘古大模型 PanguLargeModels

种类型支持选择。位置当前参数在请求信息中的位置，可选Body、Headers或Query。默认值参数的默认值。描述参数的描述，尽可能准确的描述参数的含义和要求，可提升Agent提取参数的准确率。参数校验可设置当前参数的校验规则。必填指定该参数是否为必填项。响应参数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件

总条数： 89

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

图片类加工算子介绍 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

文本类加工算子介绍 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

视频类加工算子介绍 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

创建并管理盘古工作空间 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线