搜索_华为云

清洗气象类数据集 - 盘古大模型 PanguLargeModels

清洗算子请参见表1。在左侧“添加算子”分页勾选所需算子。在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据清洗任务时，可直接单击“选择加工模板”进行使用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工气象类数据集
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。 Verification failed. Please check the content format is consistent with the template requirements. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
清洗文本类数据集 - 盘古大模型 PanguLargeModels

类清洗算子能力清单。在左侧“添加算子”分页勾选所需算子。在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据清洗任务时，可直接单击“选择加工模板”进行使用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
清洗图片类数据集 - 盘古大模型 PanguLargeModels

清洗算子请参见表1。在左侧“添加算子”分页勾选所需算子。在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据清洗任务时，可直接单击“选择加工模板”进行使用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

用于防止模型过拟合。在更新模型权重时，它会对模型参数施加惩罚，使得权重值趋于较小，从而提高模型的泛化性能。滑动平滑训练一种训练策略，通过在模型预测的标签上添加少量噪声来避免过拟合，常用于提升模型在测试数据集上的泛化能力。极大值抑制阈值在预测多个边界框时，用于去除高度重叠的边界框。此阈值控制相似的边界框保留的条件。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
创建插件 - 盘古大模型 PanguLargeModels

URL协议只支持HTTP和HTTPS。系统会校验URL地址是否为标准的URL格式。 URL对应的IP默认不应为内网，否则会导致注册失败。仅在非商用环境部署时，才允许支持内网URL，且需要通过相关的服务的启动配置项关闭内网屏蔽。请求方法插件服务的请求方式，POST或GET。鉴权校验插件服务的鉴权方式，支持以下三种：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
数据工程使用流程 - 盘古大模型 PanguLargeModels

利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。标注数据集为无标签数据集添加准确的标签，确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

基模型训练场景文件内容文件格式盘古-CV-物体检测-N 微调图片+检测标注图片+xml 训练CV大模型所需数据量初期启动训练时，每种模型类别先提供1000张已标注的图片数据进行训练，后续根据验证结果再动态提供数据迭代。图片中需要识别的目标是清晰可见的，没有遮挡、模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
提示词写作进阶技巧 - 盘古大模型 PanguLargeModels

提示词写作进阶技巧设置背景及人设明确任务需求添加CoT思维链提示父主题：提示词写作实践

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

单轮问答（人设） jsonl、csv 文本多轮问答（人设） jsonl 训练NLP大模型所需数据量使用数据工程构建盘古NLP大模型数据集进行模型训练时，所需数据量见表2。表2 构建NLP大模型所需数据量模型规格训练类型推荐数据量最小数据量（数据条数）单场景推荐训练数据量单条数据Token长度限制

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

A：先生，您家的网络无法连接是吗 A：请问您尝试重新插拔网线吗？ B：是的，我试了 B：还是不行拼接后的微调数据格式示例： {"context": ["xxx号话务员为您服务！先生您好，有什么可以帮助您的？", "你好，是这样的我家里上不了网了网连不上", "先生，您家的网络无法连接是吗

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

中控模块：盘古-NLP-N1-基础功能模型说明：该模块需要实现意图识别分类的功能。当输入意图识别模块的是政务问题时，控制下游调用检索模块；当输入不需要调用检索的非政务问题时，不调用检索，直接模型回答问题。实现方法为通过微调获得一个具有二分类能力的模型。问答模块：盘古-NLP-N2-基础功能模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
管理盘古模型资产 - 盘古大模型 PanguLargeModels

> 本空间”页面，单击支持导出的模型名称，右上角的“导出模型”。在“导出模型”页面，选择需要导出的模型，应设置导出模型时对应的导出位置（OBS桶地址），添加从环境B中下载的用户证书。设置完成后单击“确定”导出模型。图2 导出模型导入其他局点盘古大模型导入盘古大模型前，请确保当前空间为该用户所创建的空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
认证鉴权 - 盘古大模型 PanguLargeModels

AK/SK签名认证方式仅支持消息体大小12M以内，12M以上的请求请使用Token认证。 AK/SK认证就是使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从而通过身份认证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
标注视频类数据集 - 盘古大模型 PanguLargeModels

标注分配与审核配置参数类型参数名称参数说明标注分配启用多人标注关闭时，默认管理员单人标注。启用时，可以指定参与标注的人员及标注数量。标注要求选择标注项为“视频Caption”且开启AI预标注功能时，可设置以下两种方式的“标注要求”：选择“全部标注”：要求标注人员需要

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
合成文本类数据集 - 盘古大模型 PanguLargeModels

进入“合成配置”页面，选择合成内容与合成轮数，可选择开启“将源数据集整合至合成后数据”。单击“下一步”，进入“指令编排”页面，单击右上角“添加指令”。在“添加指令”页面可选择预置指令或自定义指令。预置指令。平台为用户提供了多种预置指令，便于用户执行合成任务。自定义指令。平台支持编排用

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

德的有害信息。模型安全：通过模型动态混淆技术，使模型在运行过程中保持混淆状态，有效防止结构信息和权重信息在被窃取后暴露。系统安全：通过网络隔离、身份认证和鉴权、Web安全等技术保护大模型系统安全，增强自身防护能力，以抵御外部安全攻击。父主题：大模型概念类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

选择导入的数据填写“数据集名称”和“描述”，可选择填写“拓展信息”。拓展信息包括“数据集属性”与“数据集版权”：数据集属性。可以给数据集添加行业、语言和自定义信息。数据集版权。训练模型的数据集除用户自行构建外，也可能会使用开源的数据集。数据集版权功能主要用于记录和管理数据集的

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据工程 - 盘古大模型 PanguLargeModels

过数据合成技术，可以生成大量高质量的训练数据，这些数据可以用于大模型的预训练，增强模型的泛化能力和性能。数据标注：平台支持对无标签的数据添加标签或对现有的标签进行重新标注，以提升数据集的标注质量。用户可以针对不同的数据集灵活地选择对应的标注项，还可以自定义选择多人标注、审核以及

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程介绍 - 盘古大模型 PanguLargeModels

数据合成：数据合成利用预置或自定义的数据指令对原始数据集进行处理，并根据设定的轮数生成新的数据。数据标注：数据标注旨在为无标签的数据集添加准确的标签，标注数据的质量直接影响模型的训练效果和精度。针对不同数据集平台支持人工标注与AI预标注两种形式。其中，图片Caption、视

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集

总条数： 44

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

清洗气象类数据集 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

清洗文本类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

提示词写作进阶技巧 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

管理盘古模型资产 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

合成文本类数据集 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线