搜索_华为云

什么情况下需要微调 - 盘古大模型 PanguLargeModels

强模型的泛化能力。回答的风格或格式有特殊要求：虽然通用模型学习了相当可观的基础知识，但如果目标任务要求回答必须符合特定的风格或格式，这将造成和基础知识的数据分布差异。例如，需要模型使用某银行客服的口吻进行线上问答，此时需要使用符合该银行风格和格式的数据集进行微调，以提升模型的遵循度。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建有监督训练任务 - 盘古大模型 PanguLargeModels

间消耗，且依旧可以保持较好的模型性能。训练模型选择训练所需要的模型。支持选择“预置模型”或者“我的模型”。预置模型：系统提供的LLM（大语言）预置模型。我的模型：经过用户预训练或者微调训练后的模型。模型详细介绍请参见选择模型与训练方法。训练参数指定用于训练模型的超参数。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

平缓且保持高位不下降的原因可能是目标任务的难度较大，或模型的学习率设置过小，导致模型的收敛速度太慢，无法达到最优解。您可以尝试增大训练轮数或者增大学习率来解决。图5 异常的Loss曲线：平缓且保持高位 Loss曲线异常抖动：Loss曲线异常抖动的原因可能是训练数据质量差，比如数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
理解底层任务 - 盘古大模型 PanguLargeModels

例如，在文档问答任务中，任务本质不是生成，而是抽取任务，需要让模型“从文档中抽取出问题的答案，不能是主观的理解或解释，不能修改原文的任何符号、字词和格式”，如果使用“请阅读上述文档，并生成以下问题答案”，“生成”一词不是很恰当，模型会引入一些外部知识。例如，在构造泛化问题的任务中，需要

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
创建AI助手 - 盘古大模型 PanguLargeModels

开启网页搜索后，可以通过调用web搜索来解决模型对于事实类问题回答不好的现象。添加一个工具用于拓展AI助手功能，使其能够与外部系统进行交互。可以直接创建一个工具，或者从搜索框中选择已经创建好的工具。知识库通过知识库提升AI助手在特定领域问题的回答效果。高级配置工具召回策略设置从所有可用工具中选择最相关的工具来处理用户的问题策略。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手
选择模型与训练方法 - 盘古大模型 PanguLargeModels

NLP大模型训练过程中，一般使用token来描述模型可以处理的文本长度。token（令牌）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。不同系列模型在读取中文和英文内容时，字符长

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

消极”或者“积极”：情感分类场景-典型低质量数据：数据中存在与目标任务不一致的样本。 {"context": ["请分析以下内容的情感，只回复积极或者消极\n内容：xxx], "target": "积极"} {"context": ["请分析以下内容的情感，只回复积极或者消极\n内容：xxx]

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
返回结果 - 盘古大模型 PanguLargeModels

”，则表示请求成功。响应消息头对应请求消息头，响应同样也有消息头，如“Content-Type”。响应消息体响应消息体通常以结构化格式返回，与响应消息头中Content-Type对应，传递除响应消息头之外的内容。接口调用成功后将返回如下响应体。 { "id":

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
设置背景及人设 - 盘古大模型 PanguLargeModels

行提示：“结合xxx领域的专业知识...理解/生成...”、“你需要联想与xxx相关的关键词、热点信息、行业前沿热点等...生成...”，或者可以说明已有的信息是什么领域的信息，比如“以上是金融领域的新闻”、“以上是一篇xx领域的xxx文档”。例如，“结合金融领域相关知识，生成

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集训练数据集创建流程模型训练所需数据量与数据格式要求创建一个新的数据集检测数据集质量清洗数据集（可选）发布数据集创建一个训练数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

数据批量大小是指对数据集进行分批读取训练时，所设定的每个批次数据大小。批量大小越大，训练速度越快，但是也会占用更多的内存资源，并且可能导致收敛困难或者过拟合；批量大小越小，内存消耗越小，但是收敛速度会变慢，同时模型更容易受到数据噪声的影响，从而导致模型收敛困难。您可根据数据和模型的规模

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
什么情况下不建议微调 - 盘古大模型 PanguLargeModels

虽然微调可以在一定程度上提升领域能力，但有时候微调也无法解决所有问题。即使您的目标场景依赖垂域背景知识，微调也并非最佳方案，比如：场景微调的数据量很少或者数据质量很差：微调对数据量和数据质量有很高的要求，需要使用高质量的数据进行模型训练。垂域知识问答场景：通用模型本身已经具有在给定的一段或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
Vector - 盘古大模型 PanguLargeModels

oc/docx/ppt/pptx/xls/xlsx/png/jpg/jpeg/bmp/gif/tiff/webp/pcx/ico/psd等格式文档。初始化：根据相应解析接口定义DocSplit类。以使用华为Pangu DocSplit为例： import com.huaweicloud

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Memory（记忆）
什么是提示词工程 - 盘古大模型 PanguLargeModels

上下文：包含外部信息或额外的上下文信息，引导语言模型更好地响应。输入数据：用户输入的内容或问题。输出指示：指定输出的类型或格式。提示词所需的格式取决于您想要语言模型完成的任务类型，以上要素并非都是必须的。提示词工程使用流程盘古大模型套件平台可以辅助用户进行提示词设计、

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程
文本补全 - 盘古大模型 PanguLargeModels

模型基础信息”章节。说明： token是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或者计算。 user 否 String 用于代表用户的唯一标识符，字符串长度最大64，最小1。 temperature

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
多轮对话 - 盘古大模型 PanguLargeModels

模型基础信息”章节。说明： token是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或者计算。 presence_penalty 否 Float 用于调整模型对新Token的处理方

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
Agent（智能代理） - 盘古大模型 PanguLargeModels

包括查询信息、调用服务、网络搜索、文件管理、调用云服务等，通过Agent构建一个让LLM按照特定的规则迭代运行的Prompt，直到任务完成或者达到终止条件（如设置迭代次数）。实例化Tool 实例化Agent 运行Agent 监听Agent Agent效果优化 Agent流式输出

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

“训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
Agent（智能代理） - 盘古大模型 PanguLargeModels

包括查询信息、调用服务、网络搜索、文件管理、调用云服务等，通过Agent构建一个让LLM按照特定的规则迭代运行的Prompt，直到任务完成或者达到终止条件（如设置迭代次数）。实例化Tool 实例化Agent 运行Agent 监听Agent Agent流式输出 Tool Retriever

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK

总条数： 70

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么情况下需要微调 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

理解底层任务 - 盘古大模型 PanguLargeModels

创建AI助手 - 盘古大模型 PanguLargeModels

选择模型与训练方法 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

设置背景及人设 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

什么情况下不建议微调 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

Vector - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

文本补全 - 盘古大模型 PanguLargeModels

多轮对话 - 盘古大模型 PanguLargeModels

Agent（智能代理） - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

Agent（智能代理） - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线