搜索_华为云

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

csv 训练预测大模型所需数据量训练预测大模型时，所需的数据通常为表格格式，即由行和列组成的扁平化数据。具体要求如下：行：每行代表一个样本。每行与其他行具有相同的列，并且顺序相同，这些行通常按照某种特定顺序排列。列：每列表示一种特征。每列的数据类型应保持一致，不同列可以具有不同的数据类型。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

Prop，可以调整学习率。取值范围：(0,1)。权重衰减系数通过在损失函数中加入与模型权重大小相关的惩罚项，鼓励模型保持较小的权重，防止过拟合或模型过于复杂，取值需≥0。学习率学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
大模型开发基本概念 - 盘古大模型 PanguLargeModels

训练相关概念说明概念名说明自监督学习自监督学习（Self-Supervised Learning，简称SSL）是一种机器学习方法，它从未标记的数据中提取监督信号，属于无监督学习的一个子集。该方法通过创建“预设任务”让模型从数据中学习，从而生成有用的表示，可用于后续任务。它

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

为["列名"]，默认设置为[]，表示选择最后一列作为预测目标变量。训练集&验证集比例将数据集划分为训练集和验证集。填写验证集的比例（默认为 0.2，即训练集占0.8，验证集占0.2）。可选比例包括0.1、0.2、0.3、0.4。基模型算法池对于异常检测模型：从预定义的算法

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
科学计算大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

日志提示“root: XXX valid number is 0”，表示训练集/验证集的有效样本量为0，例如： INFO: root: Train valid number is 0. 该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据不符合规格。请检查数据是否已标注或标注是否符合算法要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话场景描述此示例演示了如何使用盘古预置NLP大模型进行对话问答，包含两种方式：使用“能力调测”功能和调用API接口。您将学习如何使用“能力调测”功能调试模型超参数、如何调用盘古NLP大模型API以实现智能化对话问答能力。准备工作请确保您有预置的NLP大模型，

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格盘古NLP大模型是业界首个超千亿参数的中文预训练大模型，结合了大数据预训练和多源知识，借助持续学习不断吸收海量文本数据，持续提升模型性能。除了实现行业知识检索、文案生成、阅读理解等基础功能外，盘古NLP大模型还具备模型调用等高级特性，可在智能客服、创意

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
NLP大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

日志提示“root: XXX valid number is 0”，表示训练集/验证集的有效样本量为0，例如： INFO: root: Train valid number is 0. 该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据不符合规格。请检查数据是否已标注或标注是否符合算法要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
预测大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

日志提示“root: XXX valid number is 0”，表示训练集/验证集的有效样本量为0，例如： INFO: root: Train valid number is 0. 该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据不符合规格。请检查数据是否已标注或标注是否符合算法要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
CV大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

日志提示“root: XXX valid number is 0”，表示训练集/验证集的有效样本量为0，例如： INFO: root: Train valid number is 0. 该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据不符合规格。请检查数据是否已标注或标注是否符合算法要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

是否大于特征阈值，大于特征阈值的文档删除。 top-gram过滤：计算重复最多的garm占总长度的比例，大于特征阈值则删除。 gram重复率过滤：计算所有重复的garm占总长度的比例，大于特征阈值则删除。段落特征过滤根据如下特征过滤：段落重复率。重复段落长度占比。非中文字符占比。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，单个cls类别目录下的每个三级目录为一个样本，例如cls1文件的样本为aa和bb。所有样本文件夹（如 aa）包含的图片数量相等，例如cls1样本aa和bb、cls1样本aa和cls2的样本cc。每个样本文件夹（如 aa）可以视为一个视频片段，其中每张图片代表视频的一个帧，将这些帧作为一个序列来学习视频分类，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

推理任务中得到更高的准确性，尤其是在涉及多步推理和复杂逻辑关系的任务中。具体做法如下：提供相关示例：在提示词中加入类似的示例，帮助模型学习解题的模式和思路。通过这些示例，模型能够理解如何通过不同的推理步骤逐渐得出结论。例如，在数学问题中，可以通过展示从问题解析到公式应用再到

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

业场景中广泛用于工艺参数和性能指标的预测。矿山行业：进行智慧配煤，例如预测焦炭成分质量，优化配煤比例，提高焦炭质量，降低生产成本。进行智能浓缩，例如预测焦炭成分质量，优化配煤比例，提高焦炭质量，降低生产成本。油气行业：进行储层参数预测，例如预测储层的物理参数，如孔隙度、渗透率

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类算子名称算子描述

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

现统一查看和操作管理。数据资产：用户已发布的数据集将作为数据资产存放在空间资产中。用户可以查看数据集的详细信息，包括数据格式、大小、配比比例等。同时，平台支持数据集的删除等管理操作，使用户能够统一管理数据集资源，以便在模型训练和分析时灵活调用，确保数据资产的规范性与安全性。模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集

总条数： 71

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

科学计算大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

NLP大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

预测大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

CV大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线