搜索_华为云

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成了复读机式的结果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

少于xx个字的文本。”，将回答设置为符合要求的段落。续写：根据段落的首句、首段续写成完整的段落。若您的无监督文档没有任何结构化信息，可以将有监督的问题设置为“以下是一篇文章的第一个句子：xxx/第一段落：xxx。请根据以上的句子/段落，续写为一段不少于xx个字的文本。”，再将回答设置为符合要求的段落。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果不完整，出现了异常截断。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“最大Token限制”参数的设置，适当增加该参数的值，可以增

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
什么是盘古大模型 - 盘古大模型 PanguLargeModels

根据自己的需求选取合适的大模型相关服务和产品，方便地构建自己的模型和应用。数据工程工具链数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分，具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据流通和管理等功能。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题当您将微调的模型部署以后，输入一个已经出现在训练样本中的问题，模型生成的结果很好，一旦输入了一个从未出现过的数据（目标任务相同），回答却完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
变更计费模式 - 盘古大模型 PanguLargeModels

变更计费模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费，数据智算单元、数据通算单元默认采用按需计费，训练单元采用包周期和按需计费两种方式。盘古大模型使用周期内不支持变更配置。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”之前的内容，引言之前的内容与知识无关：[\s\S]{0，10000}0 引言针对pdf的内容，去除“1.1Java简介”之前的与知识无关的内容：[\s\S]{0，10000}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的最大利润和市值是多少？科技行业公司的最小利润和市值是多少？科技行业公司的中位利润和市值是多少？科技行业公司的总利润和市值是多少？ … 来源四：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，再基于大模型（比如盘古提供的任意一个规格的基础功能模

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
什么是提示词工程 - 盘古大模型 PanguLargeModels

得大量结果，但结果的质量与您提供的信息数量和完善度有关。一个提示词可以包含您传递到模型的指令或问题等信息，也可以包含其他种类的信息，如上下文、输入或示例等。您可以通过这些元素来更好地指导模型，并因此获得更好的结果。提示词主要包含以下要素：指令：希望模型执行的特定任务或指令，如总结、提取、生成等。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

重。图片去重通过把图片结构化处理后，过滤重复的图片/图文对数据。数据打标图片鉴黄评分对图片的涉黄程度进行评分，分数越高越危险。默认评分不小于50分的视频可视为涉黄视频。数据转换图文异常字符过滤将文本数据中携带的异常字符替换为空值，数据条目不变。不可见字符，例如U+0000-U+001F

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

宽高比过滤根据视频的宽高比进行过滤。数据打标视频鉴黄评分对视频的涉黄程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥50分的视频可视为涉黄视频。视频暴恐评分对视频的暴恐程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥50分的视频可视为暴恐视频。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
与其他服务的关系 - 盘古大模型 PanguLargeModels

与其他服务的关系与对象存储服务的关系盘古大模型使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据发布功能通过数据评估和配比，确保发布的数据集满足大模型训练的高标准。这不仅包括数据规模的要求，还涵盖了数据质量、平衡性和代表性的保证，避免数据不均衡或不具备足够多样性的情况，进而提高模型的准确性和鲁棒性。提高数据的多样性和代表性通过合理的数据配比，帮助用户按特定比例组合多个数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
如何查看预置模型的历史版本 - 盘古大模型 PanguLargeModels

如何查看预置模型的历史版本 ModelArts Studio平台支持查看预置模型的多个历史版本，并提供对历史版本进行训练等操作的功能。您还可以查看每个版本的操作记录、状态以及其他基础信息。要查看预置模型的历史版本，您可以按照以下步骤操作：进入平台的“空间资产 > 模型 > 预置”页面。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

用任务的基础能力，但还没有针对特定的业务场景进行优化。预训练后的模型主要用于多个任务的底层支持。通过使用海量的互联网文本语料对模型进行预训练，使模型理解人类语言的基本结构。微调关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

义信息。数据集版权。训练模型的数据集除用户自行构建外，也可能会使用开源的数据集。数据集版权功能主要用于记录和管理数据集的版权信息，确保数据的使用合法合规，并清晰地了解数据集的来源和相关的版权授权。通过填写这些信息，可以追溯数据的来源，明确数据使用的限制和许可，从而保护数据版权并避免版权纠纷。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
知识库介绍 - 盘古大模型 PanguLargeModels

动。知识库支持导入以下格式的本地文档：文本文档数据。支持上传常见文本格式，包括：txt、doc、docx、pdf、ppt、pptx格式。表格数据。支持上传常见的表格文件格式，便于管理和分析结构化数据，包括：xlsx、xls、csv格式。无论是文本文档、演示文稿，还是电子表

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。去噪处理：去除无关或异常值，减少对模型训练的干扰。数据预处理的目的是保证数据集的质量，使其能够有效地训练模型，并减少对模型性能的不利影响。模型开发：模型开发是大模型项目中的核心阶段，通常包括以下步骤：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识

总条数： 238

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

变更计费模式 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

与其他服务的关系 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

如何查看预置模型的历史版本 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

知识库介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线