搜索_华为云

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
配置服务访问授权 - 盘古大模型 PanguLargeModels

配置服务访问授权配置OBS访问授权 ModelArts Studio大模型开发平台使用对象存储服务（Object Storage Service，简称OBS）进行数据存储，实现安全、高可靠和低成本的存储需求。因此，为了能够顺利进行存储数据、训练模型等操作，需要用户配置访问OBS服务的权限。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
与其他服务的关系 - 盘古大模型 PanguLargeModels

与其他服务的关系与对象存储服务的关系盘古大模型使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
流通视频类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“视频 > 仅视频”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前视频类数据集仅支持发布默认格式。填写数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

预报的不确定性，从而提高预报的准确性和可靠性。集合成员数用于选择生成预报的不同初始场的数量，取值为2~10。扰动类型用于选择生成集合预报初始场的扰动类型，包括perlin加噪和CNOP加噪两种方式。 Peilin噪音通过对输入数据（比如空间坐标）进行随机扰动，让模拟出的天气接近真实世界中的变化。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

个像素值对应原图中像素的类别，且每个类别的值需连续且从0开始，表示不同的物体或区域类别。例如，假设有一张原图为IMG_20180919_114732.jpg，对应的标注图为IMG_20180919_114732.png，其中标注图的不同像素值代表不同的类别，标注图的每个像素值直接

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成了复读机式的结果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
插件介绍 - 盘古大模型 PanguLargeModels

获取结果并返回。这样的设计使得Agent能够智能处理复杂任务，甚至跨领域解决问题，实现对复杂问题的自动化处理。 Agent开发平台支持两种类型的插件：预置插件：平台为开发者和用户提供了预置插件，直接可用，无需额外开发。例如，平台提供的“Python解释器插件”能够根据用户输入的

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

内容”、“文件格式”、“导入来源”，并单击“选择路径”上传数据文件。 NLP大模型评测数据集支持的格式见表1。表1 评测数据集格式模型类型评测数据集格式 NLP大模型文本-单轮问答-jsonl格式上传数据文件后，填写“数据集名称”与“描述”，单击“立即创建”。在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 ModelArts Studio平台支持从OBS服务导入数据。您可以将本地数据上传至OBS（对象存储服务），然后通过平台提供的“数据导入”功能，将存储在OBS中的数据导入至平台进行使用。具体操作步骤如下：上传数据至OBS：将本地数据上传至OBS服务，请详见通过控制台快速使用OBS。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

x',// 数据集版本信息。 'classes': [category1',category2', ...],// 所有类别名称的列表，每个类别对应一个 label，用于标注视频中的事件或动作。 'database': { 'video_name':{

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
流通图片类数据集 - 盘古大模型 PanguLargeModels

> 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“图片 > 图片+Caption”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。由于数据工程需要支持对接盘古大模型，为了使这些

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

前包括海洋气象数据。海洋气象数据通常来源于气象再分析。气象再分析是通过现代气象模型和数据同化技术，重新处理历史观测数据，生成高质量的气象记录。这些数据既可以覆盖全球范围，也可以针对特定区域，旨在提供完整、一致且高精度的气象数据。再分析数据为二进制格式，具体格式要求详见表1。表1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。图片去重

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
流通文本类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“文本 > 预训练文本”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。由于数据工程需要支持对接盘古大模型或三方大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同当您将微调的模型部署以后，输入一个已经出现在训练样本中，或虽未出现但和训练样本差异很小的问题，回答完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
管理发布后的数据集 - 盘古大模型 PanguLargeModels

单击数据集名称查看发布数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看发布后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。在“操作记录”页签可以查看数据集所经历的操作及状态等信息。单击操作列的“删除”，可删除不需要的数据集。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
管理加工后的数据集 - 盘古大模型 PanguLargeModels

单击数据集名称查看加工数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看加工后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。在“操作记录”页签可以查看数据集所经历的操作及状态等信息。单击操作列的“删除”，可删除不需要的数据集。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求模型类别特征要求水平分辨率要求区域范围要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

从Word文档中提取文字，并保留原文档的目录、标题和正文等结构，不保留图片、表格、公式、页眉、页脚。 TXT内容提取从TXT文件中提取所有文本内容。 CSV内容提取从CSV文件中读取所有文本内容，并按该文件内容类型模板KEY值生成匹配的JSON格式数据。 PDF内容提取从PDF中提取内容转换为结构化数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍

总条数： 129

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

配置服务访问授权 - 盘古大模型 PanguLargeModels

与其他服务的关系 - 盘古大模型 PanguLargeModels

流通视频类数据集 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

插件介绍 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

流通文本类数据集 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线