搜索_华为云

训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案例库和

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗对于微调而言，数据质量非常重要。一份数据量少但质量高的数据，对于模型效果的提升要远大于一份数据量多但质量低的数据。若微调数据的质量较差，那么可能会导致模型学习到一些错误或者不完整的信息，从而影响模型的准确性和可靠性。因此，不建议您直接使用低质量数据进行微调

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建一个新的数据集 - 盘古大模型 PanguLargeModels

创建一个新的数据集数据集是指用于训练模型或评估的一组相关数据样本。存储在OBS中的数据可以通过数据集的形式放置在到盘古平台中，便于管理。在创建数据集之前，请先将数据上传至OBS平台。上传数据至OBS 登录盘古大模型套件平台。在左侧导航栏中选择“数据工程 > 数据管理”，单击界面右上角

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集训练数据集创建流程模型训练所需数据量与数据格式要求创建一个新的数据集检测数据集质量清洗数据集（可选）发布数据集创建一个训练数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好这种情况可能是由于以下几个原因导致的，建议您依次排查： Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
常见训练报错与解决方案 - 盘古大模型 PanguLargeModels

常见训练报错与解决方案 read example failed报错报错原因：模型训练过程中，训练日志出现“read example failed”报错，表示当前数据集格式不满足训练要求。解决方案：请参考数据格式要求校验数据集格式。图1 read example failed报错

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
文档摘要 - 盘古大模型 PanguLargeModels

文档摘要基于已有的知识库，进行摘要总结。有stuff、refine、map-reduce策略。 Stuff：将所有文档直接填充到prompt中，提给模型处理，适合文档较少的场景。 from pangukitsappdev.api.embeddings.factory import

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Skill（技能）
文档问答 - 盘古大模型 PanguLargeModels

文档问答基于已有的知识库进行回答。有stuff、refine和map-reduce策略。 Stuff：将所有文档直接填充到prompt中，提给模型回答，适合文档较少的场景。 from pangukitsappdev.api.embeddings.factory import Embeddings

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Skill（技能）
清洗算子功能介绍 - 盘古大模型 PanguLargeModels

清洗算子功能介绍数据清洗是提高数据质量的重要环节，包括去除异常的字符、去除表情符号和去除个人敏感内容等，经过清洗的数据可以提升训练阶段的稳定性。平台支持通过以下清洗能力：表1 清洗算子说明算子类型功能说明数据转换全角转半角将文本中的所有全角字符转换成半角字符。中文繁简体互转

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集 > 清洗数据集（可选）
约束与限制 - 盘古大模型 PanguLargeModels

约束与限制受技术等多种因素制约，盘古大模型服务存在一些约束限制。每个模型请求的最大Token数有所差异，详细请参见模型的基础信息。模型所支持的训练数据量、数据格式要求请参见《用户指南》“准备盘古大模型训练数据集 > 模型训练所需数据量与数据格式要求”。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
文档问答 - 盘古大模型 PanguLargeModels

文档问答基于已有的知识库进行回答，包括stuff、refine和map-reduce策略。 Stuff：将所有文档直接填充到prompt中，提给模型回答，适用于文档较少的场景。 import com.huaweicloud.pangu.dev.sdk.api.llms.LLMs;

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Skill（技能）
文档摘要 - 盘古大模型 PanguLargeModels

文档摘要基于已有的知识库进行摘要总结，包括stuff、refine和map-reduce策略。 Stuff：将所有文档直接填充到prompt中，提给模型处理，适用于文档较少的场景。 import com.huaweicloud.pangu.dev.sdk.api.llms.LLMs

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Skill（技能）
Cache - 盘古大模型 PanguLargeModels

Cache Cache缓存是一种临时存储数据的方法，它可以把常用的数据保存在内存或者其他设备中，这样当需要访问这些数据时，就不用再去原始的数据源查找，而是直接从缓存中获取，从而节省时间和资源。对LLM使用缓存： LLM llm = LLMs.of(LLMs.PANGU, llmConfig

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Memory（记忆）
Cache - 盘古大模型 PanguLargeModels

Cache Cache缓存是一种临时存储数据的方法，它可以把常用的数据保存在内存或者其他设备中，当需要访问这些数据时，无需再去原始的数据源查找，而是直接从缓存中获取，从而节省时间和资源。 Cache缓存有以下几种操作：初始化：指定缓存使用哪种存储方式，例如，使用内存型缓存可以设置为

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Memory（记忆）
什么情况下不建议微调 - 盘古大模型 PanguLargeModels

什么情况下不建议微调虽然微调可以在一定程度上提升领域能力，但有时候微调也无法解决所有问题。即使您的目标场景依赖垂域背景知识，微调也并非最佳方案，比如：场景微调的数据量很少或者数据质量很差：微调对数据量和数据质量有很高的要求，需要使用高质量的数据进行模型训练。垂域知识问答场景：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略

总条数： 106

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

创建一个新的数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

常见训练报错与解决方案 - 盘古大模型 PanguLargeModels

文档摘要 - 盘古大模型 PanguLargeModels

文档问答 - 盘古大模型 PanguLargeModels

清洗算子功能介绍 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

文档问答 - 盘古大模型 PanguLargeModels

文档摘要 - 盘古大模型 PanguLargeModels

Cache - 盘古大模型 PanguLargeModels

Cache - 盘古大模型 PanguLargeModels

什么情况下不建议微调 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线