搜索_华为云

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题当您将微调的模型部署以后，输入一个已经出现在训练样本中的问题，模型生成的结果很好，一旦输入了一个从未出现过的数据（目标任务相同），回答却完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
盘古自然语言大模型的适用场景有哪些 - 盘古大模型 PanguLargeModels

盘古自然语言大模型的适用场景有哪些自然语言处理大模型是一种参数量极大的预训练模型，是众多自然语言处理下游任务的基础模型。学术界和工业界的实践证明，随着模型参数规模的增加，自然语言处理下游任务的效果显著提升，这得益于海量数据、大量算力以及深度学习的飞跃发展。基于自然语言处理大模

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
选择模型与训练方法 - 盘古大模型 PanguLargeModels

选择模型与训练方法 NLP大模型 NLP大模型主要用于处理和理解人类语言，能够实现对话问答、文案生成和阅读理解等任务，并具备逻辑推理、代码生成以及插件调用等高阶能力。 NLP大模型提供了基模型和功能模型两种类型：基模型：已经在大量数据上进行了预训练，学习并理解了各种复杂特征和模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
什么是盘古大模型 - 盘古大模型 PanguLargeModels

什么是盘古大模型盘古大模型致力于深耕行业，打造多领域的行业大模型和能力集。其核心能力依托于盘古大模型套件平台，该平台是华为云推出的集数据管理、模型训练和模型部署为一体的一站式大模型开发与应用平台。平台提供了包括盘古大模型在内的多种大模型服务，支持大模型的定制开发，并提供覆盖全生命周期的大模型工具链。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
创建AI助手 - 盘古大模型 PanguLargeModels

创建AI助手登录盘古大模型套件平台。在左侧导航栏中选择“应用开发 > AI助手”，单击页面右上角“创建助手”。参考表1完成AI助手匹配。表1 创建AI助手参数说明参数分类参数名称参数说明基本信息助手名称设置AI助手的名称。描述填写AI助手的描述，如填写功能介绍。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手
创建有监督训练任务 - 盘古大模型 PanguLargeModels

创建有监督训练任务创建有监督微调训练任务登录盘古大模型套件平台。在左侧导航栏中选择“模型开发 > 模型训练”，单击界面右上角“创建训练任务”。图1 模型训练列表在训练配置中，选择模型类型、训练类型、训练方式、训练模型与训练参数。其中，训练配置选择LLM（大语言模型），

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手场景介绍随着互联网的发展，短视频已成为了日常生活中不可或缺的一部分，凭借其独特的形式和丰富的内容吸引了大量流量，并为企业和个人提供了一个全新的营销平台。短视频用户希望借助大模型快速生成高质量的口播文案，以提升营销效果和效率。在这种场景下，用户只需提供

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
配置Memory(Java SDK) - 盘古大模型 PanguLargeModels

配置Memory(Java SDK) Memory（记忆）模块结合外部存储为LLM应用提供长短期记忆能力，用于支持上下文记忆的对话、搜索增强等场景。 Memory（记忆）支持多种不同的存储方式和功能。 Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java
创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

创建自监督微调训练任务创建自监督微调训练任务登录盘古大模型套件平台。在左侧导航栏中选择“模型开发 > 模型训练”，单击界面右上角“创建训练任务”。图1 模型训练列表在训练配置中，设置模型类型、训练类型、训练模型、训练参数和checkpoints等参数。其中，训练配置选

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略什么情况下需要微调什么情况下不建议微调数据量很少，可以微调吗数据量足够，但质量较差，可以微调吗无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习如何调整训练参数，使模型效果最优如何判断训练状态是否正常如何评估微调后的模型是否正常如何调整推理参数，使模型效果最优

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
配置Memory(Python SDK) - 盘古大模型 PanguLargeModels

配置Memory(Python SDK) Memory（记忆）模块结合外部存储为LLM应用提供长短期记忆功能，用于支持上下文记忆的对话、搜索增强等场景。 Memory（记忆）支持多种不同的存储方式和功能。 Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python
基本概念 - 盘古大模型 PanguLargeModels

基本概念训练相关概念表1 训练相关概念说明概念名说明 Token 令牌（Token）是指模型处理和生成文本的基本单位。Token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成Token，然后根据模型的概率分布进行采样或者计算。例如，在英文中，有些组合单词会根

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
如何判断训练状态是否正常 - 盘古大模型 PanguLargeModels

如何判断训练状态是否正常判断训练状态是否正常，通常可以通过观察训练过程中Loss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化趋势。一般

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答会异常中断 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答会异常中断当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果不完整，出现了异常截断。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“最大Token限制”参数的设置，适当增加该参数的值，可以增大

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

查看训练任务详情与训练指标模型启动训练后，可以在模型训练列表中查看训练任务的状态，单击任务名称可以进入详情页查看训练指标、训练任务详情和训练日志。图1 模型训练列表不同类型的训练方法可支持查看的训练指标有所差异，训练指标和训练方法的关系如下：表1 训练指标和训练方法对应关系

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
盘古大模型-成长地图 - 盘古大模型 PanguLargeModels

云容器引擎-成长地图 | 华为云盘古大模型盘古大模型服务（PanguLargeModels）致力于深耕行业，打造多领域行业大模型和能力集。盘古大模型能力通过ModelArts Studio大模型开发平台承载，它提供了包括盘古大模型在内的多种大模型服务，提供覆盖全生命周期的大模型工具链。

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同当您将微调的模型部署以后，输入一个已经出现在训练样本中，或虽未出现但和训练样本差异很小的问题，回答完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
评估盘古大模型 - 盘古大模型 PanguLargeModels

评估盘古大模型创建模型评估数据集创建模型评估任务查看评估任务详情

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
批量评估提示词效果 - 盘古大模型 PanguLargeModels

批量评估提示词效果创建提示词评估数据集创建提示词评估任务查看提示词评估结果父主题：提示词工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程
安全 - 盘古大模型 PanguLargeModels

安全责任共担身份认证与访问控制数据保护技术审计监控安全风险

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍

总条数： 109

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

盘古自然语言大模型的适用场景有哪些 - 盘古大模型 PanguLargeModels

选择模型与训练方法 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

创建AI助手 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

配置Memory(Java SDK) - 盘古大模型 PanguLargeModels

创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

配置Memory(Python SDK) - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

如何判断训练状态是否正常 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答会异常中断 - 盘古大模型 PanguLargeModels

查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

盘古大模型-成长地图 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

评估盘古大模型 - 盘古大模型 PanguLargeModels

批量评估提示词效果 - 盘古大模型 PanguLargeModels

安全 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线