搜索_华为云

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

0.05, 10)。正则化参数路径删除概率用于定义路径删除机制中的删除概率。路径删除是一种正则化技术，它在训练过程中随机删除一部分的网络连接，以防止模型过拟合。这个值越大，删除的路径越多，模型的正则化效果越强，但同时也可能会降低模型的拟合能力。取值范围：[0，1）。特征删除概率

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
气象类加工算子介绍 - 盘古大模型 PanguLargeModels

平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
计费概述 - 盘古大模型 PanguLargeModels

按需计费是一种后付费模式，即先使用再付费，按照实际使用时长计费。在购买后，如果发现当前计费模式无法满足业务需求，您还可以变更计费模式。详细介绍请参见变更计费模式。计费项盘古大模型的计费项由模型订阅、数据资源、训练资源和推理资源费用组成。了解每种计费项的详细信息，请参考计费项。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
知识库介绍 - 盘古大模型 PanguLargeModels

结构化数据，包括：xlsx、xls、csv格式。无论是文本文档、演示文稿，还是电子表格文件，用户都可以轻松地将数据导入知识库，无需额外的转换或格式处理。父主题：创建与管理知识库

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

通过这些功能，平台能够帮助用户科学管理和发布数据集，确保数据集质量符合大模型训练的需求，从而提高后续模型训练的效果。数据发布意义数据发布不仅仅是将数据转换为不同格式，还包括根据任务需求评估数据集效果，确保数据在规模、质量和内容上满足训练标准。具体而言，数据发布具备以下几个重要意义：多格式支持

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
压缩NLP大模型 - 盘古大模型 PanguLargeModels

INT4：该压缩策略与INT8相比，可以进一步减少模型的存储空间和计算复杂度。配置资源。选择计费模式并设置训练单元。可选择开启订阅提醒。开启后，系统将在本次压缩任务状态变更时，向用户发送短信/邮件提醒。填写基本信息，包括任务名称、压缩后模型名称与描述，单击“立即创建”。当压缩任务状态为“已完成”时，表示模型已完成压缩操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
数据工程 - 盘古大模型 PanguLargeModels

保不同业务场景下的数据获取需求得到满足。数据加工：平台提供强大的数据加工功能，可以对文本、视频、图片、气象类型的数据进行数据提取、过滤、转换、打标签和评分等加工处理。针对不同类型的数据集，平台提供了专用的清洗算子以及支持用户创建自定义算子实现个性化的数据清洗诉求。确保生成高质量

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

选择合适的模型，从而提高模型的整体效果，详见表1。此外，不同类型的NLP大模型在训练过程中，读取中文、英文内容时，字符长度转换为Token长度的转换比有所不同，详见表2。表1 不同系列NLP大模型对处理文本的长度差异模型名称可处理最大上下文长度可处理最大输出长度说明

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
优化训练数据的质量 - 盘古大模型 PanguLargeModels

通过诱导用户下载事先写好的木马病毒:\n可以通过诱惑用户去下载某些“小便宜”，然后通过木马程序来控制用户的主机。\n2. 通过网站入侵: \n如果目标主机是一台网络服务器，可以通过找上传漏洞，然后传木马上去。如果没有上传漏洞，可以通过找SQL注入，进入后台，上传木马，提取，控制目标服务器。"} {"c

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
构建微调训练任务 - 盘古大模型 PanguLargeModels

取值范围：(0.05, 10)。正则化参数路径删除概率用于定义路径删除机制中的删除概率。路径删除是一种正则化技术，它在训练过程中随机删除一部分的网络连接，以防止模型过拟合。这个值越大，删除的路径越多，模型的正则化效果越强，但同时也可能会降低模型的拟合能力。取值范围：[0，1）。特征删除概率

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
设置背景及人设 - 盘古大模型 PanguLargeModels

设置背景及人设背景：模型基于简单prompt的生成可能是多范围的各方向发散的，如果您需要进行范围约束，或加强模型对已有信息的理解，可以进行提示：“结合xxx领域的专业知识...理解/生成...”、“你需要联想与xxx相关的关键词、热点信息、行业前沿热点等...生成...”，或

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

去除重复数据：确保数据集中每条数据的唯一性。填补缺失值：填充数据中的缺失部分，常用方法包括均值填充、中位数填充或删除缺失数据。数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。去噪处理：去除无关或异常值，减少对模型训练的干扰。数据预处理的目的是

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
大模型开发基本概念 - 盘古大模型 PanguLargeModels

大模型的计量单位token指的是什么令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个to

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

微调数据清洗：以下是该场景中实际使用的数据清洗策略，供您参考：原始文本处理。基于爬虫、数据处理平台批量处理收集到的原始数据，需要将文件统一转换成纯文本的txt文件，对错误格式数据进行删除。构建微调数据。生成垂域微调（问答对）数据，将问答对数据分为：单轮问答数据、多轮问答数据、检

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
调优典型问题 - 盘古大模型 PanguLargeModels

调优典型问题科学计算大模型调优典型问题见表1。表1 科学计算大模型调优典型问题问题可能原因解决方法预训练或微调作业失败，提示训练集数据不足。训练集选取时间区段是否不足。训练集选择的时间区段需要至少超过模型分辨率对应时长。预训练或微调作业失败，提示验证集数据不足。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
文本对话 - 盘古大模型 PanguLargeModels

N4模型：4K/32K 说明： token是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或者计算。 presence_penalty 否 Float 用于调整模型对新Token的处理

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
管理盘古模型资产 - 盘古大模型 PanguLargeModels

管理盘古模型资产模型资产介绍用户在平台中可试用、已订购或训练后发布的模型，将被视为模型资产并存储在空间资产内，方便统一管理与操作。用户可以查看模型的所有历史版本及操作记录，从而追踪模型的演变过程。同时，平台支持一系列便捷操作，包括模型训练、压缩和部署，帮助用户简化模型开发及应

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
微调典型问题 - 盘古大模型 PanguLargeModels

微调典型问题科学计算大模型微调典型问题见表1。表1 科学计算大模型微调典型问题问题可能原因解决方法预训练或微调作业失败，提示训练集数据不足。训练集选取时间区段是否不足。训练集选择的时间区段需要至少超过模型分辨率对应时长。预训练或微调作业失败，提示验证集数据不足。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳提示词与训练数据的相似度关系。提示词的效果通常与训练数据的相似度密切相关。当提示词的内容与模型在训练过程中接触过的样本数据相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类

总条数： 78

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

气象类加工算子介绍 - 盘古大模型 PanguLargeModels

计费概述 - 盘古大模型 PanguLargeModels

知识库介绍 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

优化训练数据的质量 - 盘古大模型 PanguLargeModels

构建微调训练任务 - 盘古大模型 PanguLargeModels

设置背景及人设 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

管理盘古模型资产 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

微调典型问题 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线