搜索_华为云

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。数据标注为无标签数据集添加准确的标签，确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。通过这些数据加工操作，平

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
流通图片类数据集 - 盘古大模型 PanguLargeModels

盘古大模型，为了使这些数据集能够被这些大模型正常训练，平台支持发布不同格式的数据集。当前支持默认格式、盘古格式：默认格式：数据工程功能支持的原始格式。盘古格式：使用盘古大模型训练时所需要使用的数据格式。如果使用该数据集训练盘古大模型，请将发布格式配置为盘古格式。填写数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

2024年12月发布的版本，支持全量微调、在线推理。在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古CV大模型支持的具体操作：模型预训练微调模型评测

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
计费项 - 盘古大模型 PanguLargeModels

盘古大模型分为模型订阅、数据资源、训练资源和推理资源四个收费项。模型订阅按照订阅时长预付费，提供1个月到1年供客户选择，自支付完成开始计费。数据智算单元、数据通算单元按单元使用数量和时长后付费，时长精确到秒，数据托管单元按订购数量和时长预付费，提供1个月到1年供客户选择。模型训练资源支持两种计

 帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据集”，用于后续模型训练等操作。支持的发布格式为默认格式、盘古格式（适用于训练盘古大模型时）。目前，仅文本类和图片类数据集支持发布为“盘古格式”。通过这些功能，平台能够帮助用户科学管理和发布数据集，确保数据集质量符合大模型训练的需求，从而提高后续模型训练的效果。数据发布意义

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
管理盘古模型资产 - 盘古大模型 PanguLargeModels

资产可见性。训练、压缩、部署。可在模型列表页面，对模型执行训练、压缩或部署操作。单击相应按钮，将跳转至相关操作页面。导出盘古大模型至其他局点导出盘古大模型至其他局点前，请确保当前空间为该用户所创建的空间。模型训练发布完成后，可以通过导出模型功能将本局点训练的模型导出，导出

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

需要从以下两个主要方面进行考虑：业务数据的可获取性考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取，说明模型在训练阶段可能已经接触过类似的语料，因此具有一定的理解能力。这时，通过调整提示词通常可以有效引导模型生成合理的回答。例如，对于一些常见的问答场

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
数据工程 - 盘古大模型 PanguLargeModels

数据清洗诉求。确保生成高质量的训练数据以满足业务需求和模型训练的要求。用户还可以灵活地调整算子编排顺序以及自定义清洗模板，有效提升数据清洗效率并支持大规模数据处理，确保生成的数据集符合训练的标准。数据合成：平台支持利用预置或自定义的数据指令对预训练文本、单轮问答、单轮问答（人设

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

他类数据集格式要求。表1 训练CV大模型数据集类型要求基模型训练场景文件内容文件格式盘古-CV-物体检测-N 微调图片+检测标注图片+xml 训练CV大模型所需数据量初期启动训练时，每种模型类别先提供1000张已标注的图片数据进行训练，后续根据验证结果再动态提供数据迭代。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

至关重要。不同模型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古科学计算大模型支持的具体操作：表2 盘古科学计算大模型支持的操作模型预训练微调模型评测模型压缩在线推理能力调测 Pang

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古专业大模型支持的具体操作：模型预训练微调模型压缩在线推理能力调测 Pangu-NLP-BI-4K-20241130

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务创建NLP大模型评测任务前，请确保已完成创建NLP大模型评测数据集操作。预训练的NLP大模型不支持评测。创建NLP大模型自动评测任务创建NLP大模型自动评测任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类算子名称算子描述数据提取图文提取

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
变更计费模式 - 盘古大模型 PanguLargeModels

变更计费模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费，数据智算单元、数据通算单元默认采用按需计费，训练单元采用包周期和按需计费两种方式。盘古大模型使用周期内不支持变更配置。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
与其他服务的关系 - 盘古大模型 PanguLargeModels

Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。与ModelArts服务的关系盘古大模型使用ModelArts服务进行算法训练部署，帮助用户快速创建和部署模型。与云搜索服务的关系盘古大模型使用云搜索服务CSS，加入检索模块，提高模型回复的准确性、解决内容过期问题。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
资源到期了如何续费 - 盘古大模型 PanguLargeModels

登录ModelArts Studio大模型开发平台，单击页面右上角“订购管理”。在“订购管理”页面，单击“资源订购”页签。在“资源订购”页签可进行数据资源、训练资源、推理资源的续费操作。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
同一资源是否同时支持包年/包月和按需计费两种模式 - 盘古大模型 PanguLargeModels

同一资源是否同时支持包年/包月和按需计费两种模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费。数据智算单元、数据通算单元默认采用按需计费。训练单元采用包周期和按需计费两种方式。两种计费方式不能共存，只支持按照一种计费方式进行订购。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
流通文本类数据集 - 盘古大模型 PanguLargeModels

程，用于后续模型训练等操作。单个文本类数据集支持发布的格式为：默认格式：平台默认的格式。在默认格式中，context和target是键值对。示例如下： {"context": "你好，请介绍自己", "target": "我是盘古大模型"} 盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

通过语种识别模型得到文档的语言类型，筛选所需语种的文档。全局文本去重检测并去除数据中重复或高度相似的文本，防止模型过拟合或泛化性降低。数据打标预训练文本分类针对预训练文本进行内容分类，例如新闻、教育、健康等类别，支持分析语种包括：中文、英文。通用质量评估针对文本进行通用质量的评估，例如流畅度、清晰度、丰富度等。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

提下，有效激发模型能力。 “提示词撰写” 和“提示工程”有什么区别提示词撰写实际上是构建一些问答对数据，用于模型的训练，会更新模型参数，而提示工程不涉及模型训练，仅通过提示词的优化来达到提升模型输出效果的目标。什么是好的提示词好的提示词内容明确且具体，能够指导语言模型稳定输

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践

总条数： 130

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

计费项 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

管理盘古模型资产 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

变更计费模式 - 盘古大模型 PanguLargeModels

与其他服务的关系 - 盘古大模型 PanguLargeModels

资源到期了如何续费 - 盘古大模型 PanguLargeModels

同一资源是否同时支持包年/包月和按需计费两种模式 - 盘古大模型 PanguLargeModels

流通文本类数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线