搜索_华为云

检测数据集质量 - 盘古大模型 PanguLargeModels

检测数据集质量数据集创建成功后，平台将对数据集中的数据进行质量校验，并给出健康度评分、合规度评分与数据长度分布。检测数据集质量在“数据工程 > 数据管理”页面，选择“我的数据集”或者“训练数据集”页签。单击数据集名称，进入数据集详情页，查看详细的数据质量。其中，数据长度

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

当您在微调过程中，发现模型评估的结果很好，一旦将微调的模型部署以后，输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
常见问题 - 盘古大模型 PanguLargeModels

常见问题使用java sdk出现第三方库冲突当出现第三方库冲突的时，如Jackson，okhttp3版本冲突等。可以引入如下bundle包(3.0.40-rc版本后)，该包包含所有支持的服务和重定向了SDK依赖的第三方软件，避免和业务自身依赖的库产生冲突： <dependency>

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无监督数据转换为有监督数据的方案，供您参考：基于规则构建：您可以通过采用一些简单的规则来构建有监督数据。比如：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
启用盘古大模型搜索增强能力 - 盘古大模型 PanguLargeModels

大模型在训练时使用的是静态的文本数据集，这些数据集通常是包含了截止到某一时间点的所有数据。因此，对于该时间点之后的信息，大模型可能无法提供。通过将大模型与盘古搜索结合，可以有效解决数据的时效性问题。当用户提出问题时，模型先通过搜索引擎获取最新的信息，并将这些信息整合到大模型生成的答案中，从而提供既准确又及时的答案。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
概述 - 盘古大模型 PanguLargeModels

概述盘古大模型整合华为云强大的计算和数据资源，将先进的AI算法集成在预训练大模型中，打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。华为云盘古大模型，以下功能支持API调用。表1 API清单 API 功能 NLP-文本补全给定一个

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成了复读机式的结果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
什么是盘古大模型 - 盘古大模型 PanguLargeModels

盘古大模型致力于深耕行业，打造多领域的行业大模型和能力集。其核心能力依托于盘古大模型套件平台，该平台是华为云推出的集数据管理、模型训练和模型部署为一体的一站式大模型开发与应用平台。平台提供了包括盘古大模型在内的多种大模型服务，支持大模型的定制开发，并提供覆盖全生命周期的大模型工具链。盘古大模型为开发者提供了

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
查看评估任务详情 - 盘古大模型 PanguLargeModels

指标。支持的模型指标请参见下表。表1 规则打分指标指标名称说明 BLEU-1 模型生成句子与实际句子在单字层面的匹配度，数值越高，表明模型性能越好。 BLEU-2 模型生成句子与实际句子在中词组层面的匹配度，数值越高，表明模型性能越好。 BLEU-4 模型生成结果和实际句子

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 评估盘古大模型
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

当前，大模型对于私域数据的利用仍然面临一些挑战。私域数据是由特定企业或个人所拥有的数据，通常包含了领域特定的知识。将大模型与私域知识进行结合，将发挥巨大价值。私域知识从数据形态上又可以分为非结构化与结构化数据。对于非结构化数据，如文档，可以利用大模型+外挂检索库（如Elastic Search）的方

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
创建有监督训练任务 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“模型开发 > 模型训练”，单击界面右上角“创建训练任务”。图1 模型训练列表在训练配置中，选择模型类型、训练类型、训练方式、训练模型与训练参数。其中，训练配置选择LLM（大语言模型），训练类型选择有监督训练，根据所选模型配置训练参数。表1 有监督微调参数说明参数名称说明

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
创建AI助手 - 盘古大模型 PanguLargeModels

用于对AI助手进行任务规划、工具选择和生成回复。模型版本选择与“嵌入模型”对应的版本。例如，嵌入模型为N2系列，则模型版本也为N2。工具配置网页搜索开启网页搜索后，可以通过调用web搜索来解决模型对于事实类问题回答不好的现象。添加一个工具用于拓展AI助手功能，使其能够与外部系统进行交互。可以直接创建

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手
Vector - 盘古大模型 PanguLargeModels

Vector Embedding Emebedding模块用于对Emebedding模型API的适配封装，提供统一的接口快速地调用CSS等模型emebedding能力。初始化：根据相应模型定义Emebedding类，如使用华为CSS Embedding为：Embeddings.of("css");。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Memory（记忆）
查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

公式为候选句中出现于标准译文中的单词数（m）与候选句总单词数（n）的比值，即m/n。指标看板通过BLEU-1、BLEU-2与BLEU-4评价模型性能。 BLEU-1：机器翻译、⽂本摘要等生成类任务常用的评价指标。用于评估模型生成句子与实际句子在单字层面的匹配度，数值越高，表明模型性能越好。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型
典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码为什么微调后的模型，回答会异常中断为什么微调后的模型，只能回答在训练样本中学过的问题为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同为什么微调后的模型，评估结果很好，但实际场景表现却很差多轮问答场景，为什么微调后的效果不好数据量满足要求，为什么微调后的效果不好

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集训练数据集创建流程模型训练所需数据量与数据格式要求创建一个新的数据集检测数据集质量清洗数据集（可选）发布数据集创建一个训练数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
与其他云服务的关系 - 盘古大模型 PanguLargeModels

与其他云服务的关系与对象存储服务的关系盘古大模型使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
基本概念 - 盘古大模型 PanguLargeModels

或指模型没有很好地捕捉到数据特征，不能够很好地拟合数据。损失函数损失函数（Loss Function）是用来度量模型的预测值f(x)与真实值Y的差异程度的运算函数。它是一个非负实值函数，通常使用L(Y, f(x))来表示，损失函数越小，模型的鲁棒性就越好。推理相关概念表2

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍

总条数： 66

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

检测数据集质量 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答中会出现乱码 - 盘古大模型 PanguLargeModels

启用盘古大模型搜索增强能力 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

查看评估任务详情 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

创建AI助手 - 盘古大模型 PanguLargeModels

Vector - 盘古大模型 PanguLargeModels

查看训练任务详情与训练指标 - 盘古大模型 PanguLargeModels

典型训练问题和优化策略 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

与其他云服务的关系 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线