搜索_华为云

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

科学计算大模型训练类型选择建议中期天气要素预测模型的训练类型选择建议：中期天气要素预测模型的训练支持预训练、微调两种操作，如果直接使用平台预置的中期天气要素预测模型不满足您的使用要求时，可以进行预训练或微调。预训练、微调操作的适用场景如下：预训练：训练用于添加新的高空层次、高空变量或表面变量。如

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。首先，需要根据业务需求收集相关的原始数据，确保数据的覆盖面和多样性。例如

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：理论上模型的参数规模越大，模型能学到的知识就越多，能学会的知识就更难，若目标任务本身难度较大，建议您替换参数规模更大的模型。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

少于xx个字的文本。”，将回答设置为符合要求的段落。续写：根据段落的首句、首段续写成完整的段落。若您的无监督文档没有任何结构化信息，可以将有监督的问题设置为“以下是一篇文章的第一个句子：xxx/第一段落：xxx。请根据以上的句子/段落，续写为一段不少于xx个字的文本。”，再将回答设置为符合要求的段落。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
CoT思维链 - 盘古大模型 PanguLargeModels

法等。零样本对于无样本的任务，可以采用让模型分步思考的方法来分解复杂推理或数学任务，在问题的结尾可以加上“分步骤解决问题”或者“让我们一步一步地思考”，以引导大模型进行逐步的推理和解答。通过上述指令，将一个推理任务拆解分步骤进行，可以降低推理任务的难度并可以增强答案可解释性

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化json数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”之前的内容，引言之前的内容与知识无关：[\s\S]{0，10000}0 引言针对pdf的内容，去除“1.1Java简介”之前的与知识无关的内容：[\s\S]{0，10000}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

视频鉴黄评分对视频的涉黄程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥50分的视频可视为涉黄视频。视频暴恐评分对视频的暴恐程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥50分的视频可视为暴恐视频。视频涉政评分对视频的涉政程度进行评分，分数越高越危险。评分范围(0

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
概述 - 盘古大模型 PanguLargeModels

Studio大模型开发平台部署后，可以通过API调用推理接口。盘古仅提供技术能力，不对最终生成的内容负责，建议用户在使用服务的过程中，对模型生成的内容进行适当的审核和过滤，以保证内容的安全性。父主题：使用前必读

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
大模型开发基本概念 - 盘古大模型 PanguLargeModels

多样性和一致性是评估LLM生成语言的两个重要方面。多样性指模型生成的不同输出之间的差异。一致性指相同输入对应的不同输出之间的一致性。重复惩罚重复惩罚（repetition_penalty）是在模型训练或生成过程中加入的惩罚项，旨在减少重复生成的可能性。通过在计算损失函数（用于优化模型的指标）时增加

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

此示例演示了如何使用盘古能力调测功能与盘古NLP大模型进行对话问答。您将学习如何通过调试模型超参数，实现智能化对话问答功能。准备工作请确保您有预置的NLP大模型，并已完成模型的部署操作，详见《用户指南》“开发盘古NLP大模型 > 部署NLP大模型 > 创建NLP大模型部署任务”。操作流程登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优模型微调参数的选择没有标准答案，不同的场景，有不同的调整策略。一般微调参数的影响会受到以下几个因素的影响：目标任务的难度：如果目标任务的难度较低，模型能较容易的学习知识，那么少量的训练轮数就能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数。数据量级：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
调用盘古NLP大模型API实现文本对话 - 盘古大模型 PanguLargeModels

如何通过API接口发送请求，传递对话输入，并接收模型生成的智能回复。通过这一过程，您可以快速集成NLP对话功能，使应用具备自然流畅的交互能力。准备工作调用盘古NLP大模型API实现文本对话前，请确保您已完成NLP大模型的部署操作，详见《用户指南》“开发盘古NLP大模型 > 部署NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

强模型的泛化能力。取值范围：[0,1]。给输入数据加噪音的尺度给输入数据加噪音的尺度，定义了给输入数据加噪音的尺度。这个值越大，添加的噪音越强烈，模型的正则化效果越强，但同时也可能会降低模型的拟合能力。取值范围：[0,1]。给输出数据加噪音的概率给输出数据加噪音的概率，定

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型评测、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古NLP大模型支持的具体操作：表2 盘古NLP大模型支持的能力模型预训练微调模型压缩在线推理

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

用任务的基础能力，但还没有针对特定的业务场景进行优化。预训练后的模型主要用于多个任务的底层支持。通过使用海量的互联网文本语料对模型进行预训练，使模型理解人类语言的基本结构。微调关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

计算出来的最低值。热身比例热身比例是指在模型训练过程中逐渐增加学习率的过程。在训练的初始阶段，模型的权重通常是随机初始化的，此时模型的预测能力较弱。如果直接使用较大的学习率进行训练，可能会导致模型在初始阶段更新过快，从而影响模型的收敛。为了解决这个问题，可以在训练的初始阶段

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

ss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化趋势。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题

总条数： 37

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

CoT思维链 - 盘古大模型 PanguLargeModels

图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

调用盘古NLP大模型API实现文本对话 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线