搜索_华为云

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

数据批量大小是指对数据集进行分批读取训练时，所设定的每个批次数据大小。批量大小越大，训练速度越快，但是也会占用更多的内存资源，并且可能导致收敛困难或者过拟合；批量大小越小，内存消耗越小，但是收敛速度会变慢，同时模型更容易受到数据噪声的影响，从而导致模型收敛困难。您可根据数据和模型

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。 Promp

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
压缩NLP大模型 - 盘古大模型 PanguLargeModels

压缩NLP大模型模型在部署前，通过模型压缩可以降低推理显存占用，节省推理资源提高推理性能。当前仅支持对NLP大模型进行压缩。登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“模型开发 > 模型压缩”，单击界面右上角“创建压缩任务”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

性。数据质量：请检查训练数据中是否存在文本重复的异常数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
应用场景 - 盘古大模型 PanguLargeModels

成分质量预测评估焦炭生产过程中焦炭成分及其质量，对于钢铁企业的生产效率、成本控制和环境保护具有重要意义；通过配煤比例优化，在高炉炼铁过程中合理选择和搭配不同种类、性质和质量的煤炭，降低生产成本；通过钢水温度预测，在钢铁冶炼过程中，提高钢水温度预测的准确率，确保钢水在适当的温度范围内进行浇注和连铸。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古CV大模型能力与规格盘古CV大模型基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型，赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。 ModelArts Studio大模型开发平台为用户提供了多种规格的CV大模型，以满足不同场景和需求。以下是当前支持的模型

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

景的相关数据可以公开获取，说明模型在训练阶段可能已经接触过类似的语料，因此具有一定的理解能力。这时，通过调整提示词通常可以有效引导模型生成合理的回答。例如，对于一些常见的问答场景（如常见百科问题），由于这些领域的相关数据广泛存在，模型通常能够较好地理解并生成准确回答。在这种情况

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据发布介绍 ModelArts Studio大模型开发平台提供的数据发布功能涵盖数据评估、数据配比和数据流通操作，旨在通过数据质量评估和合理的比例组合，确保数据满足大模型训练的多样性、平衡性和代表性需求，促进数据的高效流通和应用。数据发布不仅包括将数据发布为适合使用的格式，还

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据工程使用流程 - 盘古大模型 PanguLargeModels

而精确优化数据质量，确保数据满足高标准，提升模型性能。配比数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。流通数据集数据流通是将单个数据集发布为特定格式的“发布数据集”，用于后续模型训练等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的平均利润和市值是多少？识别原始问题中的槽位：科技行业公司的[metric]利润和市值是多少？采用简单的逻辑规则进行替换，获取更多数据。此处将[metric]替换为“最大”、“最小”、“中位”、“总”等，示例如下：科技行业公司的最大利润和市值是多少？科技行业公司的最小利润和市值是多少？

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

默认设置为[]，表示没有日期列，选择全部数据做训练。标识列在时间序列中可以定义粒度的id相关的列。历史窗口大小指模型在训练时基于多少个历史数据点作为输入。取值范围为[2, 200]，默认值为7，表示使用7个历史数据点作为输入进行训练。资源配置训练单元创建当前训练任务所需的训练单元数量。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

数据集进行分批读取训练，设定每个批次数据的大小。通常情况下，较大的数据批量可以使梯度更加稳定，从而有利于模型的收敛。然而，较大的数据批量也会占用更多的显存资源，这可能导致显存不足，并且会延长每次训练的时长。学习率学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
模型开发 - 盘古大模型 PanguLargeModels

场景下验证模型的准确性与可靠性。模型压缩：在模型部署前，进行模型压缩是提升推理性能的关键步骤。通过压缩模型，能够有效减少推理过程中的显存占用，节省推理资源，同时提高计算速度。当前，平台支持对NLP大模型进行压缩。模型部署：平台提供了一键式模型部署功能，用户可以轻松将训练好的模

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
管理NLP大模型部署任务 - 盘古大模型 PanguLargeModels

在“升级配置”中，选择以下两种升级模式：全量升级：新旧版本服务同时运行，直至新版本完全替代旧版本。在新版本部署完成前，旧版本仍可使用。需要该服务所消耗资源的2倍，用于保障全量一次性升级。滚动升级：部分实例资源空出用于滚动升级，逐个或逐批停止旧版本并启动新版本。滚动升级时可修

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 部署NLP大模型
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

升模型性能。评估图片类数据集、评估视频类数据集配比图片类数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比图片类数据集流通图片、视频类数据集数据流通是将单个数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
管理CV大模型部署任务 - 盘古大模型 PanguLargeModels

在“升级配置”中，选择以下两种升级模式：全量升级：新旧版本服务同时运行，直至新版本完全替代旧版本。在新版本部署完成前，旧版本仍可使用。需要该服务所消耗资源的2倍，用于保障全量一次性升级。滚动升级：部分实例资源空出用于滚动升级，逐个或逐批停止旧版本并启动新版本。滚动升级时可修

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 部署CV大模型
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

定义检测物体锚框的长宽比。通过设置不同的长短比例，模型可以更好地适应多种尺寸和形状的物体。锚框大小指锚框的初始尺寸。锚框是物体检测中的一个关键概念，通过合理设置，可以帮助模型检测出多种尺寸的目标。框重叠比例阈值用于判定模型预测的边界框与真实边界框之间是否为同一物体。该阈值用于计算IoU（交并比），影响模型的精确度。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型

总条数： 38

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

管理NLP大模型部署任务 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

管理CV大模型部署任务 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线