搜索_华为云

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

上传文件限xlsx格式。数据行数不小于10行，不大于50行。数据不允许相同表头，表头数量小于20个。数据单条文本长度不超过1000。创建数据集时会对相关限制条件进行校验。数据参考格式如下：图1 数据参考格式图2 数据示例创建提示词评估数据集登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

文本-单轮问答-jsonl格式上传数据文件后，填写“数据集名称”与“描述”，单击“立即创建”。在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面选择数据集模态并选择数据集文件。单击“下一步”，选择发布格式，填写名称，选择数据集可见性，单击“下一步”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
气象类加工算子介绍 - 盘古大模型 PanguLargeModels

气象类加工算子介绍平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
视频类加工算子介绍 - 盘古大模型 PanguLargeModels

视频类加工算子介绍数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的加工操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

SQL语句生成，支持常见的聚合函数（如去重、计数、平均、最大、最小、合计）、分组、排序、比较、条件（逻辑操作、离散条件、范围区间等条件的混合和嵌套）、日期操作，支持多表关联查询。与非专业大模型相比，专业大模型针对特定场景优化，更适合执行数据分析、报告生成和业务洞察等任务。 ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

案请参见NLP大模型训练常见报错与解决方案。训练日志可以按照不同的节点（训练阶段）进行筛选查看。分布式训练时，任务被分配到多个工作节点上进行并行处理，每个工作节点负责处理一部分数据或执行特定的计算任务。日志也可以按照不同的工作节点（如worker-0表示第一个工作节点）进行筛选查看。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
模型调优方法介绍 - 盘古大模型 PanguLargeModels

在大模型的微调效果调优过程中，训练数据优化、训练超参数优化、提示词优化以及推理参数优化是最重要的几个步骤。训练数据的优化是提升模型效果的基础。通过数据加工、去噪以及数据增强等手段，可以提高训练数据的质量和多样性，从而增强模型针对于训练场景的效果和模型的泛化能力。在准备好训练数据之后，可以通过调

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
优化训练超参数 - 盘古大模型 PanguLargeModels

若任务较复杂，那么可能就需要更多的训练轮数。数据量级：如果微调数据很多，从客观上来说越多的数据越能接近真实分布，那么可以使用较大的学习率和较大的批量大小，以提高训练效率。如果微调数据量相对较少，则可以使用较小的学习率和较小的数据批量大小，避免过拟合。通用模型的规格：如果模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

若任务较复杂，那么可能就需要更多的训练轮数。数据量级：如果微调数据很多，从客观上来说越多的数据越能接近真实分布，那么可以使用较大的学习率和较大的批量大小，以提高训练效率。如果微调数据量相对较少，则可以使用较小的学习率和较小的数据批量大小，避免过拟合。通用模型的规格：如果模型

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：大模型微调训练类

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

构建自己的模型和应用。数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分，具备数据获取、数据加工和数据发布等功能，确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据，满足不同训练任务的需求，并提供强大的数据存储和管理能力，为大模型训练提供坚实的数据支持。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
审计 - 盘古大模型 PanguLargeModels

Service，CTS）是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务并创建、配置追踪器后，CTS可记录用户使用盘古的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法，请参见CTS快速入门。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
功能总览 - 盘古大模型 PanguLargeModels

功能总览全部数据工程工具链模型开发工具链应用开发工具链能力调测应用百宝箱数据工程工具链数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分，具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据流通和管理等功能。

帮助中心 > 盘古大模型 PanguLargeModels > 功能总览
导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传当前，ModelArts Studio平台针对不同类别的数据集可使用OBS服务导入的文件形式不同：文本、视频、预测和其他类（自定义）数据集支持文件夹或单个文件导入，导入界面提示用户：“请选择文件夹或文件”。图1 支持导入单个文件示例

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类
订购盘古大模型服务 - 盘古大模型 PanguLargeModels

适用于数据加工，用于正则类算子加工。不同数据加工算子所需数据资源类型详见数据集加工算子介绍。按需（时长）计费、包年/包月 ModelArts Studio-数据智算单元适用于数据加工，用于AI类算子加工。不同数据加工算子所需数据资源类型详见数据集加工算子介绍。按需（时长）计费、包年/包月

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

请参见科学计算大模型训练常见报错与解决方案。训练日志可以按照不同的节点（训练阶段）进行筛选查看。分布式训练时，任务被分配到多个工作节点上进行并行处理，每个工作节点负责处理一部分数据或执行特定的计算任务。日志也可以按照不同的工作节点（如worker-0表示第一个工作节点）进行筛选查看。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

体的json字段中提取出所需的数据。评测配置评测类型选择“自动评测”。评测规则选择“基于规则”。评测数据集评测模板：使用预置的专业数据集进行评测。单个评测集：由用户指定评测指标（F1分数、准去率、BLEU、Rouge）并上传评测数据集进行评测。选择“单个评测集”时需要上传待评测数据集。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

数据预处理：数据预处理是数据准备过程中的重要环节，旨在提高数据质量和适应模型的需求。常见的数据预处理操作包括：去除重复数据：确保数据集中每条数据的唯一性。填补缺失值：填充数据中的缺失部分，常用方法包括均值填充、中位数填充或删除缺失数据。数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
什么是盘古大模型 - 盘古大模型 PanguLargeModels

具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据发布和管理等功能。该工具链能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力，对原始数据进行优化，确保其质量和一致性。同时，数据工程工具链还提供强大的数据存储和

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

或“温度”或“核采样”等参数的设置，适当增大其中一个参数的值，可以提升模型回答的多样性。数据质量：请检查训练数据中是否存在文本重复的异常数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类

总条数： 175

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

气象类加工算子介绍 - 盘古大模型 PanguLargeModels

视频类加工算子介绍 - 盘古大模型 PanguLargeModels

盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

模型调优方法介绍 - 盘古大模型 PanguLargeModels

优化训练超参数 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

审计 - 盘古大模型 PanguLargeModels

功能总览 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

订购盘古大模型服务 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线