搜索_华为云

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 NLP大模型训练流程介绍 NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
返回结果 - 盘古大模型 PanguLargeModels

繁华的城市，人们穿着古代的服饰，用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言，适应新的生活方式。他开始学习宋朝的礼仪，尝试理解这个时代的文化。在宋朝，李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩，她聪明伶俐，让

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

可通过调大对话轮数上限解决。 101047 初始化深度定制前后处理模块失败时触发该错误码。可检查护栏配置是否符合要求。 101048 执行深度定制用户回复改写（前处理）失败时触发该错误码。可检查前处理护栏代码。 101049 执行深度定制大模型生成的参数取值改写（后处理）失败时触发该错误码。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
大模型微调训练类问题 - 盘古大模型 PanguLargeModels

大模型微调训练类问题无监督领域知识数据量无法支持增量预训练，如何进行模型学习如何调整训练参数，使盘古大模型效果最优如何判断盘古大模型训练状态是否正常如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

训练和推理过程中，通过数据脱敏、隐私计算等技术手段识别并保护敏感数据，有效防止隐私泄露，保障个人隐私数据安全。内容安全：通过预训练和强化学习价值观提示（prompt），构建正向的意识形态。通过内容审核模块过滤违法及违背社会道德的有害信息。模型安全：通过模型动态混淆技术，使模型

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

场景中的业务逻辑较为简单、通用且易于理解，那么调整提示词是一个可行的方案。例如，对于一般的常规问题解答等场景，可以通过在提示词中引导模型学习如何简洁明了地作答。如果场景涉及较为复杂、专业的业务逻辑（例如金融分析、医疗诊断等），则需要更为精确的处理方式：如果该场景的业务规则较

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
盘古预测大模型能力与规格 - 盘古大模型 PanguLargeModels

西南-贵阳一 Pangu-Predict-Table-Cla-2.0.0 2024年12月发布的版本，支持分析历史数据中的特征与类别的关系，学习出一种映射规则或函数，然后应用这个规则对未来未知的数据点进行分类。 Pangu-Predict-Table-Reg-2.0.0 2024年

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

采。进行流体识别，例如根据测井数据，识别储层中的油、气、水等流体类型。 2024年12月发布的版本，支持分析历史数据中的特征与类别的关系，学习出一种映射规则或函数，然后应用这个规则对未来未知的数据点进行分类。 Pangu-Predict-Table-Reg-2.0.0 该模型属于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

表1 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 6 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.013

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
应用场景 - 盘古大模型 PanguLargeModels

运营成本：企业可以通过智能客服处理大部分的常规问题，将人工客服释放出来处理更复杂、更个性化的客户需求；个性化服务：基于大模型的智能客服能够学习和适应用户的行为模式和偏好，提供更加个性化的服务。农业科学计算大模型包括全球中期天气要素模型和降水模型，可以对未来一段时间的天气和降水

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

通过合理的数据配比，帮助用户按特定比例组合多个数据集，确保数据集在不同任务场景下的多样性和代表性。这样可以避免过度偏向某一类数据，保证模型能够学习到多种特征，提升对各种情况的适应能力。多格式支持对于文本类、图片类数据集，平台支持多种数据发布格式，包括“默认格式”、“盘古格式”，以

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据工程 - 盘古大模型 PanguLargeModels

数据配比：平台支持对文本、图片类数据进行数据配比。用户在勾选数据集时可以勾选多条，通过调整不同来源或类型数据的比例，以优化模型训练过程。通过数据配比可以确保模型能够更全面地学习和理解数据的多样性，提高模型的泛化能力和性能。数据流通：平台支持数据集配比、拆分发布。用户可以将处理后的数据集发布为多种格式，包括默认格

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
创建推理作业 - 盘古大模型 PanguLargeModels

Cya：蓝澡浓度 (mg/m3) Irn：铁浓度 (nano mole/L) Nit：硝酸盐浓度 (micro mole/L) MLD：混合层深度 (m) 24h 1° 在60°S至65°N，180°W至180°E覆盖全球海洋主要海域（以下简称“全球海域”）全球海浪模型 0m / SWH有效波高

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 海洋模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

表2 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 4 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.01

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

洋生态和物理过程的输入变量。包括海平面气压、海表高度、总叶绿素浓度、叶绿素浓度、硅藻浓度、颗石藻浓度、蓝藻浓度、铁浓度、硝酸盐浓度、混合层深度、海表高度、有效波高等指标。不同模型的指标以页面展示为准。深海变量用于描述海洋深层的物理和化学特性，这些参数在海洋模型中用于模拟海洋内

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型

总条数： 44

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

大模型微调训练类问题 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

盘古预测大模型能力与规格 - 盘古大模型 PanguLargeModels

预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

创建推理作业 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线