搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优模型微调参数的选择没有标准答案，不同的场景，有不同的调整策略。一般微调参数的影响会受到以下几个因素的影响：目标任务的难度：如果目标任务的难度较低，模型能较容易的学习知识，那么少量的训练轮数就能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
Token计算器 - 盘古大模型 PanguLargeModels

为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。 URI POST /v1/{project_id}/deployments/{deployment_id}/caltokens 表1 路径参数

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API
压缩NLP大模型 - 盘古大模型 PanguLargeModels

持选择已发布模型或未发布模型。选择压缩策略。除INT8压缩策略外，部分模型支持INT4压缩策略，可在选择模型后，根据页面展示的策略进行选择。 INT8：该压缩策略将模型参数压缩至8位字节，可以有效降低推理显存占用。 INT4：该压缩策略与INT8相比，可以进一步减少模型的存储空间和计算复杂度。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

"relation_operator":"xx"}]} 步骤4.综合以上内容和json格式，输出json 微调数据清洗：如下提供了该场景实际使用的数清洗策略，供您参考：判断数据中的JSON结构是否符合预先定义的接口结构。异常数据示例如下： {"context": "…", "target":

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

式接近，模型能够“回忆”并运用已学习的知识和指令。不同模型间效果差异。由于不同厂商采用的训练策略和数据集差异，同一提示词在不同模型上的效果可能大不相同。由于不同厂商采用的训练策略和数据集差异，同一提示词在不同模型上的效果可能大不相同。例如，某些模型可能在处理特定领域的数据时表

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
权限管理 - 盘古大模型 PanguLargeModels

行细粒度的控制。可以在盘古服务的委托中增加Pangu OBSWriteOnly、Pangu OBSReadOnly策略，控制OBS的读写权限。表1 策略信息策略名称拥有细粒度权限/Action 权限描述 Pangu OBSWriteOnly obs:object:AbortMultipartUpload

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
成长地图 - 盘古大模型 PanguLargeModels

云容器引擎-成长地图 | 华为云盘古大模型盘古大模型服务（PanguLargeModels）致力于深耕行业，打造多领域行业大模型和能力集。盘古大模型能力通过ModelArts Studio大模型开发平台承载，它提供了包括盘古大模型在内的多种大模型服务，提供覆盖全生命周期的大模型工具链。

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

格遵循指令进行回复的，关键信息为指令及说明。补预设当任务存在多个情境时，编写提示词时需要考虑全面，需要做好各种情境的预设，告知模型对应策略，可以有效防止模型误回答以及编造输出。父主题：提示词写作实践

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

表1 NLP大模型能力调测参数说明参数说明搜索增强搜索增强通过结合大语言模型与传统搜索引擎技术，提升了搜索结果的相关性、准确性和智能化。例如，当用户提出复杂查询时，传统搜索引擎可能仅返回一系列相关链接，而大模型则能够理解问题的上下文，结合多个搜索结果生成简洁的答案，或提

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
盘古预测大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古预测大模型能力与规格盘古预测大模型是面向结构化数据，通过任务理解、模型推荐、模型融合技术，构建通用的预测能力。 ModelArts Studio大模型开发平台为用户提供了多种规格的预测大模型，以满足不同场景和需求。以下是当前支持的模型清单，您可以根据实际需求选择最合适的模型进行开发和应用。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

org/project/rouge-score/）进行问答对的过滤。下表列举了该场景常见的数据质量问题，以及相对应的清洗策略，供您参考：表1 微调数据问题与清洗策略序号数据问题清洗步骤与方式 1 问题或回答中带有不需要的特定格式内容或者时间戳等。通过编写代码、正则表达式等进

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
概述 - 盘古大模型 PanguLargeModels

为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。 Token计算器用户在部署服务的过程中，建议开启“安全护栏”功能，以保证内容的安全性。父主题：使用前必读

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

频口播场景要求文风可以引起观众兴趣、不丢失产品特点且可以引导观众购买。微调数据清洗：下表中列举了本场景常见的数据质量问题以及相应的清洗策略，供您参考：表1 微调数据清洗步骤数据问题清洗步骤与手段清洗前清洗后问题一：数据中存在超链接、异常符号等。删除数据中的异常字符。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果不完整，出现了异常截断。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“最大Token限制”参数的设置，适当增加该参数的值，可

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

elArts Studio大模型开发平台提供的“成员管理”功能实现子用户精细的权限管理。创建用户组管理员可以创建用户组，并给用户组授予策略或角色，然后将用户加入用户组，使得用户组中的用户获得相应的权限。创建用户组的步骤如下：使用主账号登录IAM服务控制台。左侧导航窗格中

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作 > 创建并管理盘古工作空间
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

权重衰减用于防止模型过拟合。在更新模型权重时，它会对模型参数施加惩罚，使得权重值趋于较小，从而提高模型的泛化性能。滑动平滑训练一种训练策略，通过在模型预测的标签上添加少量噪声来避免过拟合，常用于提升模型在测试数据集上的泛化能力。极大值抑制阈值在预测多个边界框时，用于去除高

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。如果学习率过小，模型的收敛速度将变得非常慢。学习率调整策略用于选择学习率调度器的类型。学习率调度器可以在训练过程中动态地调整学习率，以改善模型的训练效果。目前支持CosineDecayLR调度器。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决在选择是否通过调整提示词或场景微调来解决任务时，需要从以下两个主要方面进行考虑：业务数据的可获取性考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取，说明模型在训练阶段可能已经接触过类似的语料，因此具有一

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类

总条数： 31

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

Token计算器 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

盘古预测大模型能力与规格 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线