搜索_华为云

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”之前的内容，引言之前的内容与知识无关：[\s\S]{0，10000}0 引言针对pdf的内容，去除“1.1Java简介”之前的与知识无关的内容：[\s\S]{0，10000}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。表1 视频类清洗算子能力清单算子分类算子名称算子描述数据提取镜头拆分根据视频中的镜头场景变化将长视频拆分为

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据工程 - 盘古大模型 PanguLargeModels

提升数据治理的效率和效果。通过整合上述功能，数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集，还通过全流程的数据处理和管理，探索数据与模型性能的内在联系，为模型训练和应用提供坚实的数据基础，推动了模型的精确训练与持续优化，提升了AI应用开发的效率和成果的可靠性。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置得过小，导致模型的收敛速度太慢，无法达到最优解。您可以尝试增大训练轮数或者增大学习率的方式来解决。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

可以尝试修改参数并查看模型效果。以修改“核采样”参数为例，核采样控制生成文本的多样性和质量：当“核采样”参数设置为1时，保持其他参数不变，单击“重新生成”，再单击“重新生成”，观察模型前后两次回复内容的多样性。图2 “核采样”参数为1的生成结果1 图3 “核采样”参数为1的生成结果2 将“核采样”参数调小至0.1

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

列：每列表示一种特征。每列的数据类型应保持一致，不同列可以具有不同的数据类型。顺序：表格中的行通常按照特定顺序排列。行数：数据表的行数应大于5000行。维度：数据的维度（列数）应大于10维。数据完整性：必须确保数据中没有缺失值。构建预测大模型数据集流程在ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

其中，before文件夹：包含变化前的图片，每幅图片需与变化后的图片同名、同尺寸。 after文件夹：包含变化后的图片，每幅图片需与变化前的图片同名、同尺寸。 label文件夹：包含与变化前和变化后图片同名、同尺寸的PNG文件。每个像素值代表该位置对应的类别信息，类别应是连续的且从0开始。视频分类图片

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

如何利用提示词提高大模型在难度较高推理任务中的准确率可以通过思维链的方式提高大模型在复杂推理任务中的准确率。思维链是一种通过分步骤推理来提升大模型在复杂任务中表现的方法。通过引导模型思考问题的过程，可以使其在推理任务中得到更高的准确性，尤其是在涉及多步推理和复杂逻辑关系的任务中。具体做法如下：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

2024年11月发布的版本，仅支持32K序列长度推理部署。在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型评测、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古NLP大模型支持的具体操作：表2 盘古NLP大模型支持的能力

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

于训练。标准化列指定需要进行最大最小值标准化处理的数值特征的列表。格式为["列名1","列名2"]，默认设置为[]，表示没有特征需要标准化。标准化将特征值缩放到0到1的范围，处理分布差异较大的数值特征。预测目标列指定预测目标变量的列名，仅支持单目标变量预测。格式为["列名

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于利用少量的特定任务数据，使模型的表现从通用性向具体任务需求过渡。使用小规模的特定任务数据：微调通常需要小规模但高质量的标注数据，直接与目标任务相关。通过这些数据，模型可以学习到任务特定的特征和模式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
盘古推理SDK简介 - 盘古大模型 PanguLargeModels

盘古推理SDK简介推理SDK概述盘古大模型推理SDK是对REST API进行的封装，通过该SDK可以处理用户的输入，生成模型的回复，从而实现自然流畅的对话体验。表1 推理SDK清单 SDK分类 SDK功能支持语言使用场景推理SDK 对话问答（/chat/completions）

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
创建专业大模型部署任务 - 盘古大模型 PanguLargeModels

在“从资产选模型”选择所需模型。部署方式云上部署：算法部署至平台提供的资源池中。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安全护栏基础版，内置了默认的内容审核规则。资源配置计费模式包年包月计费模式。实例数设置部署模型时所需的实例数。订阅提醒订阅提醒该功能开启后，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古专业大模型 > 部署专业大模型
创建NLP大模型部署任务 - 盘古大模型 PanguLargeModels

当前支持安全护栏基础版，内置了默认的内容审核规则。资源配置计费模式包年包月计费模式。实例数设置部署模型时所需的实例数。订阅提醒订阅提醒该功能开启后，系统将在任务状态更新时，通过短信或邮件将提醒发送给用户。基本信息服务名称设置部署任务的名称。描述（选填）设置部署任务的描述。参数填写完成后，单击“立即部署”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 部署NLP大模型
创建CV大模型部署任务 - 盘古大模型 PanguLargeModels

CV大模型部署参数说明参数分类部署参数参数说明部署配置模型来源选择“盘古大模型”。模型类型选择“CV大模型”。部署模型选择需要进行部署的模型。部署方式选择“云上部署”。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安全护栏基础版，内置了默认的内容审核规则。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 部署CV大模型
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中一个参数的值，可以提升模型回答的确定性，避免生成异常内容。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成了复读机式的结果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
身份认证与访问控制 - 盘古大模型 PanguLargeModels

用户可以通过调用REST网络的API来访问盘古大模型服务，有以下两种调用方式： Token认证：通过Token认证调用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。经过认证的请求总是需要包含一个签名值，该签名值以请求者的访问密钥

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全

总条数： 79

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

盘古推理SDK简介 - 盘古大模型 PanguLargeModels

创建专业大模型部署任务 - 盘古大模型 PanguLargeModels

创建NLP大模型部署任务 - 盘古大模型 PanguLargeModels

创建CV大模型部署任务 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

身份认证与访问控制 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线