搜索_华为云

训练数据集创建流程 - 盘古大模型 PanguLargeModels

训练数据集创建流程数据是大模型训练的基础，提供了模型学习所需的知识和信息。大模型通过对大量数据的学习，能够理解并抽象出其中的复杂模式，从而进行精准的预测和决策。在训练过程中，数据的质量和多样性至关重要。高质量的数据能够提升模型对任务的理解，而多样化的数据则帮助模型更好地应对各种情况

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

创建提示词评估数据集批量评估提示词效果前，需要先上传提示词变量数据文件用于创建对应的评估数据集。提示词变量是一种可以在文本生成中动态替换的占位符，用于根据不同的场景或用户输入生成不同的内容。其中，变量名称可以是任意的文字，用于描述变量的含义或作用。提示词评估数据集约束限制上传文件限

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 批量评估提示词效果
常见问题 - 盘古大模型 PanguLargeModels

常见问题使用java sdk出现第三方库冲突当出现第三方库冲突的时，如Jackson，okhttp3版本冲突等。可以引入如下bundle包(3.0.40-rc版本后)，该包包含所有支持的服务和重定向了SDK依赖的第三方软件，避免和业务自身依赖的库产生冲突： <dependency

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案例库和

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
创建一个训练数据集 - 盘古大模型 PanguLargeModels

创建一个训练数据集训练数据集是用于模型训练的实际数据集。通常，通过创建一个新的数据集步骤，可以生成包含某个特定场景数据的数据集。例如，这个数据集可能只包含用于训练摘要提取功能的数据。然而，在实际模型训练中，通常需要结合多种任务类型的数据，而不仅限于单一场景的数据。因此，实际的训练会混合不同类型的数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集训练数据集创建流程模型训练所需数据量与数据格式要求创建一个新的数据集检测数据集质量清洗数据集（可选）发布数据集创建一个训练数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
创建模型评估数据集 - 盘古大模型 PanguLargeModels

创建模型评估数据集在收集评估数据集时，应确保数据集的独立性和随机性，并使其能够代表现实世界的样本数据，以避免对评估结果产生偏差。对评估数据集进行分析，可以帮助了解模型在不同情境下的表现，从而得到模型的优化方向。在“数据工程 > 数据管理”中创建“评测”类型的数据集作为评估数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 评估盘古大模型
审计 - 盘古大模型 PanguLargeModels

审计云审计服务（Cloud Trace Service，CTS）是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗对于微调而言，数据质量非常重要。一份数据量少但质量高的数据，对于模型效果的提升要远大于一份数据量多但质量低的数据。若微调数据的质量较差，那么可能会导致模型学习到一些错误或者不完整的信息，从而影响模型的准确性和可靠性。因此，不建议您直接使用低质量数据进行微调

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建一个新的数据集 - 盘古大模型 PanguLargeModels

创建一个新的数据集数据集是指用于训练模型或评估的一组相关数据样本。存储在OBS中的数据可以通过数据集的形式放置在到盘古平台中，便于管理。在创建数据集之前，请先将数据上传至OBS平台。上传数据至OBS 登录盘古大模型套件平台。在左侧导航栏中选择“数据工程 > 数据管理”，单击界面右上角

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：典型训练问题和优化策略

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建有监督训练任务 - 盘古大模型 PanguLargeModels

创建有监督训练任务创建有监督微调训练任务登录盘古大模型套件平台。在左侧导航栏中选择“模型开发 > 模型训练”，单击界面右上角“创建训练任务”。图1 模型训练列表在训练配置中，选择模型类型、训练类型、训练方式、训练模型与训练参数。其中，训练配置选择LLM（大语言模型），训练类型选择有监督训练

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
清洗算子功能介绍 - 盘古大模型 PanguLargeModels

清洗算子功能介绍数据清洗是提高数据质量的重要环节，包括去除异常的字符、去除表情符号和去除个人敏感内容等，经过清洗的数据可以提升训练阶段的稳定性。平台支持通过以下清洗能力：表1 清洗算子说明算子类型功能说明数据转换全角转半角将文本中的所有全角字符转换成半角字符。中文繁简体互转

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集 > 清洗数据集（可选）
无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优模型微调参数的选择没有标准答案，不同的场景，有不同的调整策略。一般微调参数的影响会受到以下几个因素的影响：目标任务的难度：如果目标任务的难度较低，模型能较容易的学习知识，那么少量的训练轮数就能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
配置文档摘要能力(Python SDK) - 盘古大模型 PanguLargeModels

配置文档摘要能力(Python SDK) 基于已有的知识库，进行摘要总结。有stuff、refine、map-reduce策略。 Stuff：将所有文档直接填充到prompt中，提给模型处理，适合文档较少的场景。 from pangukitsappdev.api.embeddings.factory

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python > 配置Skill(Python SDK)
数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好这种情况可能是由于以下几个原因导致的，建议您依次排查： Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
约束与限制 - 盘古大模型 PanguLargeModels

约束与限制受技术等多种因素制约，盘古大模型服务存在一些约束限制。每个模型请求的最大Token数有所差异，详细请参见模型的基础信息。模型所支持的训练数据量、数据格式要求请参见《用户指南》“准备盘古大模型训练数据集 > 模型训练所需数据量与数据格式要求”。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题

总条数： 108

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练数据集创建流程 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需要考虑哪些方面 - 盘古大模型 PanguLargeModels

创建一个训练数据集 - 盘古大模型 PanguLargeModels

准备盘古大模型训练数据集 - 盘古大模型 PanguLargeModels

创建模型评估数据集 - 盘古大模型 PanguLargeModels

审计 - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

创建一个新的数据集 - 盘古大模型 PanguLargeModels

数据量满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

清洗算子功能介绍 - 盘古大模型 PanguLargeModels

无监督的领域知识数据，量级无法支持增量预训练，如何让模型学习 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

配置文档摘要能力(Python SDK) - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线