搜索_华为云

创建数据集清洗任务 - 盘古大模型 PanguLargeModels

输出路径默认为系统生成，您也可以自定义输出路径，当前支持覆盖和追加两种方式。覆盖：清洗后数据覆盖和替换原有数据集内容。追加：清洗后数据增加到原有数据集路径下。任务信息填写完成后，单击“下一步”，搭建数据清洗流程。可以使用预置的清洗模板完成对数据集的清洗，也可以基于算子搭建清洗流程。图2 搭建数据清洗流程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集 > 清洗数据集（可选）
准备工作 - 盘古大模型 PanguLargeModels

置）。 IAM endpoint需要根据服务所在的区域正确配置，参考帮助文档“终端节点”章节查找。参考IAM帮助文档，获取账号相关信息。华为云Gallery托管三方模型否 Gallery三方托管模型API调用URL。华为云IAM账号认证信息。三方大模型API参考文档：申请资源时，可联系客户支持获取。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK
认证鉴权 - 盘古大模型 PanguLargeModels

Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。如果您的华为云账号已升级为华

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
构造请求 - 盘古大模型 PanguLargeModels

letions 请求消息头附加请求头字段，如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”，请求鉴权信息等。如下公共消息头需要添加到请求中。 Content-Type：消息体的类型（格式），必选，默认取值为“application/json”。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
获取API认证鉴权信息（获取Token） - 盘古大模型 PanguLargeModels

“西南-贵阳一”区域对应的project id。图1 查看盘古服务区域图2 获取user name、domain name、project id 下载并安装Postman调测工具。打开Postman，新建一个POST请求，输入“西南-贵阳一”区域的“获取Token”接口，并填写请求Header参数。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
常见训练报错与解决方案 - 盘古大模型 PanguLargeModels

s设大，保证日志中的Sink_num > 0。图3 The dataset size is too small Decrypt failed报错报错原因：模型训练过程中，训练日志出现“Decrypt failed”报错，表示解密失败。解决方案：请联系华为云排查环境变量ak、sk。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
调用AI助手API - 盘古大模型 PanguLargeModels

用于更改AI助手的指令。包含instructions和additional_instructions两个参数。 instructions：AI助手的描述信息。 additional_instructions：用于在当前会话中向AI助手中补充附加信息，例如与用户查询问题相关的上下文信息。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手
Memory（记忆） - 盘古大模型 PanguLargeModels

上下文记忆的对话、搜索增强等场景。 Memory（记忆）支持多种不同的存储方式和功能。 Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存可以根据不同的存储方式进行初始化、更新、查找和清理操作。缓存还可以支持语义匹配和查询，通过向量和相似度的计算，实现对数据的语义理解和检索。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
Memory（记忆） - 盘古大模型 PanguLargeModels

上下文记忆的对话、搜索增强等场景。 Memory（记忆）支持多种不同的存储方式和功能。 Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存可以根据不同的存储方式进行初始化、更新、查找和清理操作。缓存还可以支持语义匹配和查询，通过向量和相似度的计算，实现对数据的语义理解和检索。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的最大利润和市值是多少？科技行业公司的最小利润和市值是多少？科技行业公司的中位利润和市值是多少？科技行业公司的总利润和市值是多少？ … 来源四：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，再基于大模型（比如盘古提供的任意一个规格的基础功能模

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优模型微调参数的选择没有标准答案，不同的场景，有不同的调整策略。一般微调参数的影响会受到以下几个因素的影响：目标任务的难度：如果目标任务的难度较低，模型能较容易的学习知识，那么少量的训练轮数就能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数。数据量级：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
基本概念 - 盘古大模型 PanguLargeModels

令牌（Token）是指模型处理和生成文本的基本单位。Token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成Token，然后根据模型的概率分布进行采样或者计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个Token：“over”和“weight”

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

慢，但会减少内存消耗，且可能提高泛化能力。因此，批大小需要根据数据集的规模和特点，以及模型的复杂度和性能进行调整。同时，批大小还与学习率相关。学习率是指每次更新参数时，沿着梯度方向移动的步长。一般来说，批大小和学习率成正比。如果批大小增大，学习率也相应增大；如果批大小减小，那么学习率也应减小。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

如何调整推理参数，使模型效果最优为什么微调后的模型，回答总是在重复某一句或某几句话为什么微调后的模型，回答中会出现乱码为什么微调后的模型，回答会异常中断为什么微调后的模型，只能回答在训练样本中学过的问题为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同为什么微调后的模型，评估结果很好，但实际场景表现却很差

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
创建一个训练数据集 - 盘古大模型 PanguLargeModels

训练数据集是用于模型训练的实际数据集。通常，通过创建一个新的数据集步骤，可以生成包含某个特定场景数据的数据集。例如，这个数据集可能只包含用于训练摘要提取功能的数据。然而，在实际模型训练中，通常需要结合多种任务类型的数据，而不仅限于单一场景的数据。因此，实际的训练会混合不同类型的数据。例如，为

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
补说明 - 盘古大模型 PanguLargeModels

意输出格式中的key不要有语义重复，并且需要与前文要求中的key名字保持一致，否则模型会不理解是同一个key。恰当的表述可以尝试从英语的逻辑去设计提示词。最好是主谓宾结构完整的句子，少用缩写和特殊句式。应使用常见的词汇和语言表达方式，避免使用生僻单词和复杂的句式，防止机器理解偏差。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 常用方法论
什么情况下需要微调 - 盘古大模型 PanguLargeModels

业等），需要依赖很深的领域背景知识，那么通用模型可能无法满足这些要求，需要在该领域的数据集上进行微调，以增强模型的泛化能力。回答的风格或格式有特殊要求：虽然通用模型学习了相当可观的基础知识，但如果目标任务要求回答必须符合特定的风格或格式，这将造成和基础知识的数据分布差异。例如，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
什么情况下不建议微调 - 盘古大模型 PanguLargeModels

果您的场景是基于某个领域内的知识问答，那么采用微调的手段确实能从一定程度上提升效果，但如果综合考虑训练的耗时和模型后续的持续迭代，采用搜索+问答的方案则更具性价比。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建有监督训练任务 - 盘古大模型 PanguLargeModels

LoRA轶值 / 8、16、32、64 较高的取值意味着更多的参数被更新，模型具有更大的灵活性，但需要更多的计算资源和内存。较低的取值则意味着更少的参数更新，资源消耗更少，但模型的表达能力可能受到限制。训练轮数 4 1~50 完成全部训练数据集训练的次数。学习率 0.0001 0~1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
Agent（智能代理） - 盘古大模型 PanguLargeModels

Agent（智能代理），用于对复杂任务的自动拆解与外部工具调用执行，一般包括任务规划、记忆系统和执行系统。任务规划：将复杂目标任务分解为小的可执行子任务，通过评估、自我反思等方式提升规划成功率。记忆系统：通过构建记忆模块去管理历史任务和策略，并让Agent结合记忆模块中相关的信息以获取最优化任务解决策略。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK

总条数： 147

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据集清洗任务 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

获取API认证鉴权信息（获取Token） - 盘古大模型 PanguLargeModels

常见训练报错与解决方案 - 盘古大模型 PanguLargeModels

调用AI助手API - 盘古大模型 PanguLargeModels

Memory（记忆） - 盘古大模型 PanguLargeModels

Memory（记忆） - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

创建一个训练数据集 - 盘古大模型 PanguLargeModels

补说明 - 盘古大模型 PanguLargeModels

什么情况下需要微调 - 盘古大模型 PanguLargeModels

什么情况下不建议微调 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

Agent（智能代理） - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线