搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。 Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
CoT思维链 - 盘古大模型 PanguLargeModels

更高的结果。单样本/多样本可以在提示词中提供示例，让模型先学习后回答，在使用这种方法时需要约束新样例不能照抄前面给的参考样例，新样例必须多样化、不能重复等，否则可能会直接嫁接前文样例的内容，也可以约束只是让它学习参考样例的xxx生成思路、xxx风格、xxx生成方法等。零样本

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

本支持全量微调、LoRA微调、INT8量化、断点续训、在线推理和能力调测特性。 Pangu-NLP-N1-Chat-128K-20241030 128K 此版本是2024年10月发布的十亿级模型版本，支持128K序列长度在线推理。基于Snt9B3卡支持8卡推理部署，此模型版本仅支

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

用于天气基础要素预测，时间分辨率为1小时。支持预训练、微调、在线推理、能力调测特性，基于Snt9B33，支持1个训练单元训练及1个推理单元部署。 Pangu-AI4S-Weather_3h-20241030 用于天气基础要素预测，时间分辨率为3小时。支持预训练、微调、在线推理、能力调测特性，基于Snt9B

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

INT8量化、断点续训、在线推理和能力调测特性。单卡部署4K模型版本支持64并发，单卡部署32K模型版本支持32并发。 Pangu-NLP-N1-Chat-128K-20241030 128K 此版本是2024年10月发布的十亿级模型版本，支持128K在线推理。基于Snt9B3卡

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话场景描述此示例演示了如何使用盘古能力调测功能与盘古NLP大模型进行对话问答。您将学习如何通过调试模型超参数，实现智能化对话问答功能。准备工作请确保您有预置的NLP大模型，并已完成模型的部署操作，详见《用户指南》“开发盘古NLP大模型 >

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
创建盘古图片类数据集标注任务 - 盘古大模型 PanguLargeModels

创建盘古图片类数据集标注任务场景描述此示例演示了如何快速创建图片Caption数据标注任务。您将学习如何设置任务参数、配置标注要求并进行标注。准备工作请提前准备数据并上传至OBS服务，上传步骤请详见通过控制台快速使用OBS。操作流程登录ModelArts Studio大模型开发平台，进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
调用盘古NLP大模型API实现文本对话 - 盘古大模型 PanguLargeModels

调用盘古NLP大模型API实现文本对话场景描述此示例演示了如何调用盘古NLP大模型API实现文本对话功能。您将学习如何通过API接口发送请求，传递对话输入，并接收模型生成的智能回复。通过这一过程，您可以快速集成NLP对话功能，使应用具备自然流畅的交互能力。准备工作调用盘古

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍大模型（Large Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

decay）的机制，可以有效地防止过拟合（overfitting）的问题。学习率衰减比率学习率衰减后的比率，用于控制训练过程中学习率的下降幅度。经过衰减后，学习率的最低值由初始学习率和衰减比率决定。其计算公式为：最低学习率 = 初始学习率 * 学习率衰减比率。也就是说，学习率在每次衰减后不会低于这个计算出来的最低值。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
盘古推理SDK简介 - 盘古大模型 PanguLargeModels

推理SDK 对话问答（/chat/completions） Java、Python、Go、.NET、NodeJs 基于对话问答功能，用户可以与模型进行自然而流畅的对话和交流。 - 通用文本（/text/completions） Java、Python、Go、.NET、NodeJs、PHP

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
大模型开发基本概念 - 盘古大模型 PanguLargeModels

训练相关概念说明概念名说明自监督学习自监督学习（Self-Supervised Learning，简称SSL）是一种机器学习方法，它从未标记的数据中提取监督信号，属于无监督学习的一个子集。该方法通过创建“预设任务”让模型从数据中学习，从而生成有用的表示，可用于后续任务。它

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

以调整学习率。取值范围：(0,1)。权重衰减系数用于定义权重衰减的系数。权重衰减是一种正则化技术，可以防止模型过拟合。取值需≥0。学习率用于定义学习率的大小。学习率决定了模型参数在每次更新时变化的幅度。如果学习率过大，模型可能会在最优解附近震荡而无法收敛。如果学习率过小，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
返回结果 - 盘古大模型 PanguLargeModels

繁华的城市，人们穿着古代的服饰，用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言，适应新的生活方式。他开始学习宋朝的礼仪，尝试理解这个时代的文化。在宋朝，李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩，她聪明伶俐，让

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
使用推理SDK - 盘古大模型 PanguLargeModels

请在SDK中心获取最新的sdk包版本，替换示例中版本。表1 安装推理SDK SDK语言安装方法 Java 在您的操作系统中下载并安装Maven，安装完成后您只需要在Java项目的pom.xml文件中加入相应的依赖项即可。 <dependency> <groupId>com

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题

总条数： 37

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

CoT思维链 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

创建盘古图片类数据集标注任务 - 盘古大模型 PanguLargeModels

调用盘古NLP大模型API实现文本对话 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

盘古推理SDK简介 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

使用推理SDK - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线