搜索_华为云

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

解，同时具备逻辑推理、代码生成和插件调用等高级功能。 NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古科学计算大模型能力与规格盘古科学计算大模型面向气象、医药、水务、机械、航天航空等领域，融合了AI数据建模和AI方程求解方法。该模型从海量数据中提取数理规律，利用神经网络编码微分方程，通过 AI 模型更快速、更精准地解决科学计算问题。 ModelArts Studio大模型开发平台为用

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据工程使用流程 - 盘古大模型 PanguLargeModels

高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。在ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集
返回结果 - 盘古大模型 PanguLargeModels

繁华的城市，人们穿着古代的服饰，用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言，适应新的生活方式。他开始学习宋朝的礼仪，尝试理解这个时代的文化。在宋朝，李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩，她聪明伶俐，让

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
使用盘古加工算子构建单轮问答数据集 - 盘古大模型 PanguLargeModels

此示例演示了如何使用加工算子轻松构建单轮问答数据集。数据集的加工算子是一种灵活的数据预处理工具，能够帮助您将原始数据转化为所需的格式。通过使用加工算子，您可以提取、转换、过滤原始数据，生成适合大模型训练的数据集。准备工作请提前准备数据并上传至OBS服务，上传步骤请详见通过控制台快速使用OBS。操作流程

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据集加工场景介绍数据加工概念数据加工是数据工程中的核心环节，旨在通过使用数据集加工算子对原始数据进行清洗、转换、提取和过滤等操作，以确保数据符合模型训练的标准和业务需求。通过这一过程，用户能够优化数据质量，去除噪声和冗余信息，提升数据的准确性和一致性，为后续的模型训练提供

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
大模型微调训练类问题 - 盘古大模型 PanguLargeModels

大模型微调训练类问题无监督领域知识数据量无法支持增量预训练，如何进行模型学习如何调整训练参数，使盘古大模型效果最优如何判断盘古大模型训练状态是否正常如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
应用场景 - 盘古大模型 PanguLargeModels

运营成本：企业可以通过智能客服处理大部分的常规问题，将人工客服释放出来处理更复杂、更个性化的客户需求；个性化服务：基于大模型的智能客服能够学习和适应用户的行为模式和偏好，提供更加个性化的服务。农业科学计算大模型包括全球中期天气要素模型和降水模型，可以对未来一段时间的天气和降水

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

与前文要求中的key名字保持一致，否则模型会不理解是同一个key。恰当的表述可以尝试从英语的逻辑去设计提示词。最好是主谓宾结构完整的句子，少用缩写和特殊句式。应使用常见的词汇和语言表达方式，避免使用生僻单词和复杂的句式，防止机器理解偏差。多用肯定句，少用否定句，比如“你不能A

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
数据集标注场景介绍 - 盘古大模型 PanguLargeModels

、视频等，可以针对不同的数据和业务场景提供定制化的标注方案，满足多样化的需求。增强模型的准确性与鲁棒性：准确的标注数据能够帮助模型更好地学习数据的潜在模式和规律，进而提高模型的性能、准确性和鲁棒性。节省时间与成本：AI预标注可以显著减少人工干预，提高标注的效率和一致性，帮助用

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集
发布文本类数据集 - 盘古大模型 PanguLargeModels

单击“下一步”。在“已选择数据集配比”中，用户可以设置从数据集中抽取指定数量的数据用于训练。进行数据配比的目的是为了确保模型能够更全面地学习和理解数据的多样性，提升模型的泛化能力和性能。图4 发布方式2 图5 数据集配比设置发布格式。由于数据工程需要支持对接盘古大模型或三方

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

单击“下一步”。在“已选择数据集配比”中，用户可以设置从数据集中抽取指定数量的数据用于训练。进行数据配比的目的是为了确保模型能够更全面地学习和理解数据的多样性，提升模型的泛化能力和性能。图4 发布方式2 图5 数据集配比设置发布格式。由于数据工程需要支持对接盘古大模型或三方

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

问答模型的微调核心参数设置训练参数设置值数据批量大小（batch_size） 4 训练轮数（epoch） 3 学习率（learning_rate） 3e-6 学习率衰减比率（learning_rate_decay_ratio） 0.01 热身比例（warmup） 0.1 评估和优化模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

表1 微调核心参数设置训练参数设置值数据批量大小（batch_size） 8 训练轮数（epoch） 6 学习率（learning_rate） 7.5e-05 学习率衰减比率（learning_rate_decay_ratio） 0.067 热身比例（warmup） 0.013

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
什么是提示词工程 - 盘古大模型 PanguLargeModels

或示例等。您可以通过这些元素来更好地指导模型，并因此获得更好的结果。提示词主要包含以下要素：指令：希望模型执行的特定任务或指令，如总结、提取、生成等。上下文：包含外部信息或额外的上下文信息，引导语言模型更好地响应。输入数据：用户输入的内容或问题。输出指示：指定输出的类型或格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程

总条数： 46

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

使用盘古加工算子构建单轮问答数据集 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

大模型微调训练类问题 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

数据集标注场景介绍 - 盘古大模型 PanguLargeModels

发布文本类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线