搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程介绍科学计算大模型的训练主要分为两个阶段：预训练与微调。预训练阶段：预训练是模型学习基础知识的过程，基于大规模通用数据集进行。例如，在区域海洋要素预测中，可以重新定义深海变量、海表变量，调整深度层、时间分辨率、水平分辨率以及区域范围，以适配自定义区域的模型场景。此阶段需预先准备区域的高精度数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

Prop，可以调整学习率。取值范围：(0,1)。权重衰减系数通过在损失函数中加入与模型权重大小相关的惩罚项，鼓励模型保持较小的权重，防止过拟合或模型过于复杂，取值需≥0。学习率学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
训练参数优化 - 盘古大模型 PanguLargeModels

科学计算大模型的学习率调优策略如下：学习率太小时，损失曲线几乎是一条水平线，下降非常缓慢，此时可以增大学习率，使用学习率预热（Warm-up）的方法，在训练初期逐步增加学习率，避免初始阶段学习率过小。学习率太大时，损失曲线剧烈震荡，甚至出现梯度爆炸的问题，可以使用学习率衰减（De

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传当前，ModelArts Studio平台针对不同类别的数据集可使用OBS服务导入的文件形式不同：文本、视频、预测和其他类（自定义）数据集支持文件夹或单个文件导入，导入界面提示用户：“请选择文件夹或文件”。图1 支持导入单个文件示例

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类
大模型微调训练类 - 盘古大模型 PanguLargeModels

大模型微调训练类无监督领域知识数据量无法支持增量预训练，如何进行模型学习如何调整训练参数，使盘古大模型效果最优如何判断盘古大模型训练状态是否正常如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
图片类加工算子介绍 - 盘古大模型 PanguLargeModels

量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类加工算子，算子能力清单见表1。表1 图片类加工算子能力清单算子分类算子名称算子描述数据提取图文提取提取图文压缩包中的JSON文本和图片，并对图片进行结构化解析（BASE64编码）。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

模型优化与部署：将训练好的大模型部署到生产环境中，可能通过云服务或本地服务器进行推理服务。此时要考虑到模型的响应时间和并发能力。模型监控与迭代：部署后的模型需要持续监控其性能，并根据反馈进行定期更新或再训练。随着新数据的加入，模型可能需要进行调整，以保证其在实际应用中的表现稳定。在应用阶段，除了

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。针对预训练阶段，还可以继续进行训练，这一过程称为增量预训练。增量预训练是在已

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
优化训练超参数 - 盘古大模型 PanguLargeModels

较小的学习率，反之可以使用较大的学习率。如果您没有专业的调优经验，可以优先使用平台提供的默认值，再结合训练过程中模型的收敛情况动态调整。学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话场景描述此示例演示了如何使用盘古预置NLP大模型进行对话问答，包含两种方式：使用“能力调测”功能和调用API接口。您将学习如何使用“能力调测”功能调试模型超参数、如何调用盘古NLP大模型API以实现智能化对话问答能力。准备工作请确保您

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

帮助模型学习解题的模式和思路。通过这些示例，模型能够理解如何通过不同的推理步骤逐渐得出结论。例如，在数学问题中，可以通过展示从问题解析到公式应用再到最终解答的完整过程，帮助模型理解问题解决的逻辑。引导模型分析：如果没有直接的示例或现有示例不适用，可以引导模型首先进行“详细分析

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
视频类加工算子介绍 - 盘古大模型 PanguLargeModels

该镜头片段将按时长进行进一步拆分。数据过滤视频裁剪裁剪视频中字幕/Logo/水印/黑框等无用信息，生成新视频。视频元数据过滤基于视频元数据进行过滤，包括帧率、分辨率和视频时长。注：电影标准帧率为24或30FPS。宽高比过滤根据视频的宽高比进行过滤。数据打标视频鉴黄评分

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
大模型开发基本概念 - 盘古大模型 PanguLargeModels

有监督学习有监督学习是机器学习任务的一种。它从有标记的训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入和期望的输出。 LoRA 局部微调（LoRA）是一种优化技术，用于在深度学习模型的微调过程中，只对模型的一部分参数进行更新，而不是对所有参数进行更新。这种

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、结构和语言的理解，因此，提示词中包含的关键词、句式和语境如果与训练数据中的模式接近，模型能够“回忆”并运用已学习的知识和指令。不同模型间效果差异。由于不同厂商采用的训练策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

例如，对于一般的常规问题解答等场景，可以通过在提示词中引导模型学习如何简洁明了地作答。如果场景涉及较为复杂、专业的业务逻辑（例如金融分析、医疗诊断等），则需要更为精确的处理方式：如果该场景的业务规则较少且易于概括，可以尝试使用few-shot方式，通过向模型提供少量示例来让其理解任务并进行推理。如果业务规则复杂

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。 Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
CoT思维链 - 盘古大模型 PanguLargeModels

更高的结果。单样本/多样本可以在提示词中提供示例，让模型先学习后回答，在使用这种方法时需要约束新样例不能照抄前面给的参考样例，新样例必须多样化、不能重复等，否则可能会直接嫁接前文样例的内容，也可以约束只是让它学习参考样例的xxx生成思路、xxx风格、xxx生成方法等。零样本

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧

总条数： 170

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

训练参数优化 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的单个文件进行上传 - 盘古大模型 PanguLargeModels

大模型微调训练类 - 盘古大模型 PanguLargeModels

图片类加工算子介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

优化训练超参数 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

视频类加工算子介绍 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

CoT思维链 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线