搜索_华为云

大模型开发基本概念 - 盘古大模型 PanguLargeModels

令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个token：“over”、“weight”。在中文中，

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
模型能力与规格 - 盘古大模型 PanguLargeModels

模型能力与规格盘古NLP大模型能力与规格盘古CV大模型能力与规格盘古科学计算大模型能力与规格盘古预测大模型能力与规格盘古专业大模型能力与规格

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

用于判断文档重复度，根据特征N值计算文档内词语按N值组合后的重复此时，可通过以下两种算法比较结果是否大于特征阈值，大于特征阈值的文档删除。 top-gram过滤：计算重复最多的garm占总长度的比例，大于特征阈值则删除。 gram重复率过滤：计算所有重复的garm占总长度的比例，大于特征阈值则删除。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

"target":"你好，请问有什么可以帮助你的？"},{"context":"请介绍一下华为云的产品。","target":"华为云提供包括但不限于计算、存储、网络等产品服务。"}] 单个文件大小不超过50GB，文件数量最多1000个。。多轮问答（人设） jsonl jsonl格式：数组格式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
压缩NLP大模型 - 盘古大模型 PanguLargeModels

INT8：该压缩策略将模型参数压缩至8位字节，可以有效降低推理显存占用。 INT4：该压缩策略与INT8相比，可以进一步减少模型的存储空间和计算复杂度。配置资源。选择计费模式并设置训练单元。可选择开启订阅提醒。开启后，系统将在本次压缩任务状态变更时，向用户发送短信/邮件提醒。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

针对Token转换比，平台提供了Token计算器功能，可以根据您输入的文本计算Token数量，您可以通过以下方式使用该功能：在左侧导航栏选择“能力调测”，单击右下角“Token计算器”使用该功能。使用API调用Token计算器，详见《API参考》“API > Token计算器”。 NLP大模型训练类型选择建议

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：数据集清洗算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

选择“全量微调”。全量微调：在模型进行有监督微调时，对大模型的所有参数进行更新。这种方法通常能够实现最佳的模型性能，但需要消耗大量计算资源和时间，计算开销较大。基础模型选择全量微调所用的基础模型，可从“已发布模型”或“未发布模型”中进行选择。高级设置 checkpoint

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
身份认证与访问控制 - 盘古大模型 PanguLargeModels

Key）加密调用请求。经过认证的请求总是需要包含一个签名值，该签名值以请求者的访问密钥（AK/SK）作为加密因子，结合请求体携带的特定信息计算而成。通过访问密钥（AK/SK）认证方式进行认证鉴权，即使用Access Key ID（AK）/Secret Access Key（SK）加密的方法来验证某个请求发送者身份。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

发的第一步。首先，需要根据业务需求收集相关的原始数据，确保数据的覆盖面和多样性。例如，若是自然语言处理任务，可能需要大量的文本数据；如果是计算机视觉任务，则需要图像或视频数据。数据预处理：数据预处理是数据准备过程中的重要环节，旨在提高数据质量和适应模型的需求。常见的数据预处理操作包括：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

评测指标（自动评测-使用评测模板）指标说明评测得分每个数据集上的得分为模型在当前数据集上的通过率；评测能力项中若有多个数据集则按照数据量的大小计算通过率的加权平均数。综合能力综合能力是计算所有数据集通过率的加权平均数。表3 NLP大模型人工评测指标说明评测指标（人工评测）指标说明准确性模型生成答案正确且无事实性错误。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

学习率衰减比率（learning_rate_decay_ratio） 0~1 0.01~0.1 学习率衰减比率用于设置训练过程中的学习率衰减的最小值。计算公式为：最小学习率=学习率*学习率衰减比率。参数的选择没有标准答案，您需要根据任务的实际情况进行调整，以上建议值仅供参考。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
添加CoT思维链提示 - 盘古大模型 PanguLargeModels

通过上述指令，将一个推理任务拆解分步骤进行，可以降低推理任务的难度并可以增强答案可解释性。另外，相比直接输出答案，分步解决也容许大模型有更多的“思考时间”，用更多的计算资源解决该问题。自洽性同一问题使用大模型回答多次，生成多个推理路径及答案，选择一致性最高的结果作为最终答案。父主题：提示词写作进阶技巧

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
插件介绍 - 盘古大模型 PanguLargeModels

平台提供的“Python解释器插件”能够根据用户输入的问题自动生成Python代码，并执行该代码获取结果。此插件为Agent提供了强大的计算、数据处理和分析功能，用户只需将其添加到应用中，即可扩展功能。自定义插件：为了满足更个性化的需求，平台允许开发者创建自定义插件，支持将A

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

、人员离岗检测、动植物检测、工业缺陷检测等。 2024年12月发布的版本，支持全量微调、在线推理。物体检测-N模型为中参数量模型，在保证计算效率的同时，具备较强的特征识别能力，提供高效的性能表现。父主题：训练CV大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
应用场景 - 盘古大模型 PanguLargeModels

出来处理更复杂、更个性化的客户需求；个性化服务：基于大模型的智能客服能够学习和适应用户的行为模式和偏好，提供更加个性化的服务。农业科学计算大模型包括全球中期天气要素模型和降水模型，可以对未来一段时间的天气和降水进行预测，全球中期天气要素模型和降水模型能够在全球范围内进行预测，

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

引导模型分析：如果没有直接的示例或现有示例不适用，可以引导模型首先进行“详细分析”，然后再给出答案。这意味着在提示词中明确要求模型逐步分析问题的各个方面，帮助模型消耗更多的计算资源进行全面推理。这样，模型能够在多个推理步骤后得出更准确的结论，而不是直接跳到最终答案，减少了过度简化或跳跃推理的可能性。分步推理与反

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
权限管理 - 盘古大模型 PanguLargeModels

将其加入用户组，并对用户组授权，才能使得用户组中的用户获得对应的权限。授权后，用户就可以基于被授予的权限对云服务进行操作。服务使用OBS存储训练数据和评估数据，如果需要对OBS的访问权限进行细粒度的控制。可以在盘古服务的委托中增加Pangu OBSWriteOnly、Pangu

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频涉政评分对视频的涉政程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥90分的视频可视为涉政视频。运动幅度评分通过计算每个像素在每一帧中的移动范围进行评分，识别运动幅度过快（如＞100光流）或过慢（如≤2光流）的视频，数值越大表示运动过快。质量基础评分

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

概念，通过合理设置，可以帮助模型检测出多种尺寸的目标。框重叠比例阈值用于判定模型预测的边界框与真实边界框之间是否为同一物体。该阈值用于计算IoU（交并比），影响模型的精确度。热身轮次表示在模型训练初期，逐步增加学习率到预设值的训练轮次，用于帮助模型在训练初期稳定收敛，避免大幅度的参数更新导致不稳定的学习过程。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型

总条数： 99

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

大模型开发基本概念 - 盘古大模型 PanguLargeModels

模型能力与规格 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

身份认证与访问控制 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

添加CoT思维链提示 - 盘古大模型 PanguLargeModels

插件介绍 - 盘古大模型 PanguLargeModels

CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

如何利用提示词提高大模型在难度较高推理任务中的准确率 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线