搜索_华为云

什么情况下需要微调 - 盘古大模型 PanguLargeModels

目标任务依赖垂域背景知识：通用模型学习到的知识大部分都是来自互联网上的开源数据，如果目标任务本身属于某个领域（如金融、政务、法律、医疗、工业等），需要依赖很深的领域背景知识，那么通用模型可能无法满足这些要求，需要在该领域的数据集上进行微调，以增强模型的泛化能力。回答的风格或格式有特殊要求

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

微调数据清洗：以下是该场景中实际使用的数据清洗策略，供您参考：原始文本处理。基于爬虫、数据处理平台批量处理收集到的原始数据，需要将文件统一转换成纯文本的txt文件，对错误格式数据进行删除。构建微调数据。生成垂域微调（问答对）数据，将问答对数据分为：单轮问答数据、多轮问答

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
创建有监督训练任务 - 盘古大模型 PanguLargeModels

明、表5。在数据配置中，选择训练数据集、验证数据等参数。验证数据可选择“从训练数据拆分”和“从已有数据导入”。从训练数据拆分：取值范围[1%-50%]。设置1%即从训练数据中随机拆分出1%的数据作为验证集，验证集中最多使用100条数据用于模型训练效果评估。数据按比例拆分后，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
文本补全 - 盘古大模型 PanguLargeModels

/v1/{project_id}/deployments/{deployment_id}/text/completions 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见获取项目ID。 deployment_id 是 String 模型的部

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
购买盘古大模型套件 - 盘古大模型 PanguLargeModels

盘古大模型套件在订购时分为模型资产和模型推理资产。模型资产即盘古系列大模型，用户可以订购盘古基模型、功能模型、专业大模型。基模型：基模型经过大规模数据的预训练，能够学习并理解多种复杂特征和模式。这些模型可作为各种任务的基础，包括但不限于阅读理解、文本生成和情感分析等，但不具备对话问答能力。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
查看提示词评估结果 - 盘古大模型 PanguLargeModels

例如，在图2中有10条评估用例，当前已经评估了8条，剩余2条待评估。图2 查看评估进展评估完成后，进入“评估报告”页面，可以查看每条数据的评估结果。在评估结果中，“预期结果”即为变量值（问题）所预设的期望回答，“生成结果”即模型回复的结果。通过比较“预期结果”与“生成结果”的差异可以判断提示词效果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 批量评估提示词效果
什么是盘古大模型 - 盘古大模型 PanguLargeModels

己的模型。数据工程套件数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程套件作为盘古大模型服务的重要组成部分，具备数据获取、清洗、配比和管理等功能。该套件能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力，对原

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

默认值范围说明数据批量大小 8 >=1 数据集进行分批读取训练，设定每个批次数据的大小。一般来说，批大小越大，训练速度越快，但会占用更多的内存资源，且可能导致收敛困难或过拟合。批大小越小，训练速度越慢，但会减少内存消耗，且可能提高泛化能力。因此，批大小需要根据数据集的规模和特点

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
预览提示词效果 - 盘古大模型 PanguLargeModels

的变量值信息。输入变量值后预览区域会自动组装展示提示词。用户也可以直接选择已创建的变量集填入变量值信息，变量集是一个excel文件，每行数据是需要输入的变量值信息，可以通过“导入”功能进行上传。图1 预览提示词效果单击“查看效果”按钮，输出模型回复结果，用户可以根据预览效果调整提示词的文本和变量。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 撰写提示词
盘古自然语言大模型的适用场景有哪些 - 盘古大模型 PanguLargeModels

是众多自然语言处理下游任务的基础模型。学术界和工业界的实践证明，随着模型参数规模的增加，自然语言处理下游任务的效果显著提升，这得益于海量数据、大量算力以及深度学习的飞跃发展。基于自然语言处理大模型的预训练模型，可以根据业务需求开发出诸如营销文案生成、阅读理解、智能对话和代码生成等应用功能。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
选择模型与训练方法 - 盘古大模型 PanguLargeModels

盘古-NLP-BI专业大模型-4K 4096 基于NLP-N2-基础功能模型运用特定专业代码数据训练后的BI专业大模型，具有4K上下文能力。盘古-NLP-BI专业大模型-32K 32768 基于NLP-N2-基础功能模型运用特定专业代码数据训练后的BI专业大模型，具有32K上下文能力。盘古-NLP-N2单场景模型-4K

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
多轮对话 - 盘古大模型 PanguLargeModels

/v1/{project_id}/deployments/{deployment_id}/chat/completions 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见获取项目ID。 deployment_id 是 String 模型的部

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
构造请求 - 盘古大模型 PanguLargeModels

ents/{deployment_id}/text/completions），其中{project_id}需要替换成用户的项目ID。拼接起来如下所示。 https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/text/completions

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
获取Token消耗规则 - 盘古大模型 PanguLargeModels

优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型训练前评估文本的Token数量，提供费用预估，并优化数据预处理策略。使用Token计算器的步骤如下：登录盘古大模型套件平台。在“服务管理”页面，单击页面右上角“Token计算器”。在To

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 平台资源管理
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

选择基模型/基础功能模型盘古-NLP-N2-基础功能模型准备训练数据本场景不涉及自监督训练，无需准备自监督数据。微调数据来源：来源一：真实业务场景数据。来源二：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，然后利用大模型（如盘古提供的任意规格的基础功能模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
配置Memory(Java SDK) - 盘古大模型 PanguLargeModels

Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存可以根据不同的存储方式进行初始化、更新、查找和清理操作。缓存还可以支持语义匹配和查询，通过向量和相似度的计算，实现对数据的语义理解和检索。 Vector向量存储：是一种将数据转换为数学表示的方法，它可以度量数据之间的关系和

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略什么情况下需要微调什么情况下不建议微调数据量很少，可以微调吗数据量足够，但质量较差，可以微调吗无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习如何调整训练参数，使模型效果最优如何判断训练状态是否正常如何评估微调后的模型是否正常如何调整推理参数，使模型效果最优

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
配置Memory(Python SDK) - 盘古大模型 PanguLargeModels

Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存可以根据不同的存储方式进行初始化、更新、查找和清理操作。缓存还可以支持语义匹配和查询，通过向量和相似度的计算，实现对数据的语义理解和检索。 Vector向量存储：是一种将数据转换为数学表示的方法，它可以度量数据之间的关系和

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python

总条数： 110

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么情况下需要微调 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

文本补全 - 盘古大模型 PanguLargeModels

购买盘古大模型套件 - 盘古大模型 PanguLargeModels

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

查看提示词评估结果 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

预览提示词效果 - 盘古大模型 PanguLargeModels

盘古自然语言大模型的适用场景有哪些 - 盘古大模型 PanguLargeModels

选择模型与训练方法 - 盘古大模型 PanguLargeModels

多轮对话 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

获取Token消耗规则 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

配置Memory(Java SDK) - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

配置Memory(Python SDK) - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线