搜索_华为云

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

训练NLP大模型所需数据量使用数据工程构建盘古NLP大模型数据集进行模型训练时，所需数据量见表2。表2 构建NLP大模型所需数据量模型规格训练类型推荐数据量最小数据量（数据条数）单场景推荐训练数据量单条数据Token长度限制 N1 微调 - 1000条/每场景 ≥ 1万条/每场景

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
数据工程使用流程 - 盘古大模型 PanguLargeModels

可根据需求选择预置标准或自定义评估标准，从而精确优化数据质量，确保数据满足高标准，提升模型性能。配比数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。流通数据集数据流

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
变更计费模式 - 盘古大模型 PanguLargeModels

变更计费模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费，数据智算单元、数据通算单元默认采用按需计费，训练单元采用包周期和按需计费两种方式。盘古大模型使用周期内不支持变更配置。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
调用工作流 - 盘古大模型 PanguLargeModels

"start_time": 1734337068533, "end_time": 1734337082545 } 父主题：编排与调用工作流

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

应用中提供准确的预测结果。应用与部署：当大模型训练完成并通过验证后，进入应用阶段。主要包括以下几个方面：模型优化与部署：将训练好的大模型部署到生产环境中，可能通过云服务或本地服务器进行推理服务。此时要考虑到模型的响应时间和并发能力。模型监控与迭代：部署后的模型需要持续监控其

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
责任共担 - 盘古大模型 PanguLargeModels

理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施，包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
数据工程 - 盘古大模型 PanguLargeModels

通过整合上述功能，数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集，还通过全流程的数据处理和管理，探索数据与模型性能的内在联系，为模型训练和应用提供坚实的数据基础，推动了模型的精确训练与持续优化，提升了AI应用开发的效率和成果的可靠性。父主题：产品功能

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

\"relation_operator\":\"名称与内容的逻辑关系\"}],\"having_filters\":[{\"value\":[\"值内容\"],\"caption\":\"度量名称\",\"relation_operator\":\"名称与内容的逻辑关系\"}]},\"orde

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

而精确优化数据质量，确保数据满足高标准，提升模型性能。评估图片类数据集、评估视频类数据集配比图片类数据集数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比图片类数据集流通图片、视频类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
成长地图 - 盘古大模型 PanguLargeModels

在线体验图说ECS 成长地图由浅入深，带您玩转盘古大模型 01 了解了解盘古大模型的概念、优势、应用场景以及模型能力与规格，您将更全面地掌握其强大功能，助力您在不同领域实现创新，加速业务智能化升级。产品介绍什么是盘古大模型产品优势应用场景产品功能模型能力与规格基础知识

 帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

以增大模型回答生成的长度，避免生成异常截断。请注意，该参数值存在上限，请结合目标任务的实际需要以及模型支持的长度限制来调整。模型规格：不同规格的模型支持的长度不同，若目标任务本身需要生成的长度已经超过模型上限，建议您替换可支持更长长度的模型。数据质量：请检查训练数据中是否存在

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

以使用较小的学习率和较小的数据批量大小，避免过拟合。通用模型的规格：如果模型参数规模较小，那么可能需要较大的学习率和较大的批量大小，以提高训练效率。如果规模较大，那么可能需要较小的学习率和较小的批量大小，防止内存溢出。这里提供了一些微调参数的建议值和说明，供您参考：表1 微调参数的建议和说明

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
请求URI - 盘古大模型 PanguLargeModels

请求URI 服务的请求URI即API服务的终端地址，通过该地址与API进行通信和交互。 URI获取步骤如下：登录ModelArts Studio大模型开发平台。进入所需工作空间。获取请求URI。获取模型请求URI。若调用部署后的模型，可在左侧导航栏中选择“模型开发 >

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无监督数据转换为有监督数据的方案，供您参考：基于规则构建：您可以通过采用一些简单的规则来构建有监督数据。比如：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
概述 - 盘古大模型 PanguLargeModels

度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。盘古大模型在ModelArts Studio大模型开发平台部署后，可以通过API调用推理接口。表1 API清单 API 功能操作指导 NLP大模型-文本对话基于对话问答功能，用户可以与模型进行自然而流畅的对话和交流。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
文本对话 - 盘古大模型 PanguLargeModels

最大值：不同模型支持的token长度，请参见《产品介绍》“模型能力与规格 > 盘古NLP大模型能力与规格”章节。缺省值：默认部署时token长度最大值，请参见《产品介绍》“模型能力与规格 > 盘古NLP大模型能力与规格”章节。说明： token是指模型处理和生成文本的基本单位。t

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

当前，大模型对于私域数据的利用仍然面临一些挑战。私域数据是由特定企业或个人所拥有的数据，通常包含了领域特定的知识。将大模型与私域知识进行结合，将发挥巨大价值。私域知识从数据形态上又可以分为非结构化与结构化数据。对于非结构化数据，如文档，可以利用大模型+外挂检索库（如Elastic Search）的方

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

来源一：真实业务场景数据。来源二：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，然后利用大模型（如盘古提供的任意规格的基础功能模型）采用self-instruct等方式，泛化出更多的业务场景数据。方法一：在大模型输入的Prompt中包含“人设赋予”、“

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
获取项目ID - 盘古大模型 PanguLargeModels

名和IAM用户ID。在调用盘古API时，获取的项目id需要与盘古服务部署区域一致，例如盘古大模型当前部署在“西南-贵阳一”区域，需要获取与贵阳一区域的对应的项目id。图2 获取项目ID 多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。调用API获取项目ID 项目

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
返回结果 - 盘古大模型 PanguLargeModels

请求成功。响应消息头对应请求消息头，响应同样也有消息头，如“Content-Type”。响应消息体响应消息体通常以结构化格式返回，与响应消息头中Content-Type对应，传递除响应消息头之外的内容。接口调用成功后将返回如下响应体。 { "id": "180f

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API

总条数： 92

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

变更计费模式 - 盘古大模型 PanguLargeModels

调用工作流 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

责任共担 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

请求URI - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

获取项目ID - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线