搜索_华为云

数据量很少，可以微调吗 - 盘古大模型 PanguLargeModels

数据量很少，可以微调吗不同规格的模型对微调的数据量都有相应要求。如果您准备用于微调的数据量很少，无法满足最小的量级要求，那么不建议您直接使用该数据进行微调，否则可能会存在如下问题：过拟合：当微调数据量很小时，为了能充分学习这些数据的知识，可能会训练较多的轮次，因而模型会过分

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
准备工作 - 盘古大模型 PanguLargeModels

1:6379 华为云RDS 否 host信息。用户认证信息。云数据库RDS： https://support.huaweicloud.com/rds/index.html - Mysql 否 host信息。用户认证信息。 Mysql官网： https://www.mysql.com/

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗对于微调而言，数据质量非常重要。一份数据量少但质量高的数据，对于模型效果的提升要远大于一份数据量多但质量低的数据。若微调数据的质量较差，那么可能会导致模型学习到一些错误或者不完整的信息，从而影响模型的准确性和可靠性。因此，不建议您直接使用低质量数据进行微调。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
模型训练所需数据量与数据格式要求 - 盘古大模型 PanguLargeModels

模型训练所需数据量与数据格式要求盘古大模型套件平台支持NLP大模型的训练。不同模型训练所需的数据量和数据格式有所差异，请基于数据要求提前准备训练数据。数据量要求自监督训练在单次训练任务中，一个自监督训练数据集内，上传的数据文件数量不得超过1000个，单文件大小不得超过1G

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好这种情况可能是由于以下几个原因导致的，建议您依次排查： Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
安装SDK - 盘古大模型 PanguLargeModels

安装SDK pip直接安装执行如下命令： pip install pangu_kits_app_dev_py 本地导入从support网站上下载pangu-kits-app-dev-py的whl包。建议使用conda创建一个新的python环境，python版本选择3.9。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK
配置SDK - 盘古大模型 PanguLargeModels

embedding.css.iam.url= # sdk.embedding.css.iam.domain= # sdk.embedding.css.iam.user= # sdk.embedding.css.iam.password= # sdk.embedding.css.iam.project=

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK
配置SDK - 盘古大模型 PanguLargeModels

embedding.css.iam.url= # sdk.embedding.css.iam.domain= # sdk.embedding.css.iam.user= # sdk.embedding.css.iam.password= # sdk.embedding.css.iam.project=

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
创建有监督训练任务 - 盘古大模型 PanguLargeModels

给用户。图3 基本信息单击“立即创建”，创建有监督微调训练任务。有监督微调（全量微调）训练参数说明不同模型训练参数默认值存在一定差异，请以前端页面展示的默认值为准。表2 有监督微调（全量微调）参数说明训练参数默认值范围说明数据批量大小 8 >=1 数据集进行分批读取训练，设定每个批次数据的大小。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
约束与限制 - 盘古大模型 PanguLargeModels

束限制。每个模型请求的最大Token数有所差异，详细请参见模型的基础信息。模型所支持的训练数据量、数据格式要求请参见《用户指南》“准备盘古大模型训练数据集 > 模型训练所需数据量与数据格式要求”。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
Tool Retriever - 盘古大模型 PanguLargeModels

"description"]) css_tool_retriever = CSSToolRetriever(tool_provider, vector_config) # 添加工具 css_tool_retriever.add_tools(tool_list) # 添加多轮改写 css_tool_retriever

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Agent（智能代理）
Tool Retriever - 盘古大模型 PanguLargeModels

inMemoryToolProvider.add(toolList); // 初始化CSSToolRetriever final CSSToolRetriever cssToolRetriever = new CSSToolRetriever(inMemoryToolProvider,

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Agent（智能代理）
Vector - 盘古大模型 PanguLargeModels

server_info=ServerInfoCss(env_prefix="sdk.memory.css")) vector_api = Vectors.of("css", vector_store_config) # 检索 docs = vector_api.similarity_search("bar",

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Memory（记忆）
迁移盘古大模型 - 盘古大模型 PanguLargeModels

迁移盘古大模型模型训练完成后，可以通过迁移（导入模型、导出模型）功能将本局点训练的模型导出，或将其他局点训练的模型导入本局点进行使用。支持迁移操作的模型可以在“模型开发 > 模型管理 > 我的模型”中查看。图1 模型管理导入/导出模型以从环境A迁移模型到环境B为例：登

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
什么情况下不建议微调 - 盘古大模型 PanguLargeModels

虽然微调可以在一定程度上提升领域能力，但有时候微调也无法解决所有问题。即使您的目标场景依赖垂域背景知识，微调也并非最佳方案，比如：场景微调的数据量很少或者数据质量很差：微调对数据量和数据质量有很高的要求，需要使用高质量的数据进行模型训练。垂域知识问答场景：通用模型本身已经具有在给定的一段或几段段落知

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
应用场景 - 盘古大模型 PanguLargeModels

加了企业的运营成本，也影响了用户体验。盘古大模型的引入为这一问题提供了有效解决方案。盘古大模型通过将客户知识数据转换为向量并存储在向量数据库中，利用先进的自然语言处理技术对用户输入的文本进行深度分析和理解。它能够精准识别用户的意图和需求，即使是复杂或模糊的查询，也能提供准确的响

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
搜索增强 - 盘古大模型 PanguLargeModels

sdk.embedding.css.iam.password= sdk.embedding.css.iam.project= ## CSS 向量库 sdk.memory.css.url= sdk.memory.css.user= sdk.memory.css.password= 工程实现。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > 应用示例
预览提示词效果 - 盘古大模型 PanguLargeModels

输入变量值后预览区域会自动组装展示提示词。用户也可以直接选择已创建的变量集填入变量值信息，变量集是一个excel文件，每行数据是需要输入的变量值信息，可以通过“导入”功能进行上传。图1 预览提示词效果单击“查看效果”按钮，输出模型回复结果，用户可以根据预览效果调整提示词的文本和变量。父主题：撰写提示词

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 撰写提示词

总条数： 72

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据量很少，可以微调吗 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

模型训练所需数据量与数据格式要求 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

安装SDK - 盘古大模型 PanguLargeModels

配置SDK - 盘古大模型 PanguLargeModels

配置SDK - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

Tool Retriever - 盘古大模型 PanguLargeModels

Tool Retriever - 盘古大模型 PanguLargeModels

Vector - 盘古大模型 PanguLargeModels

迁移盘古大模型 - 盘古大模型 PanguLargeModels

什么情况下不建议微调 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

搜索增强 - 盘古大模型 PanguLargeModels

预览提示词效果 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线