搜索_华为云

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

行自动检测和过滤。文本长度过滤按照设置的文本长度，保留长度范围内的数据进行。冗余信息过滤按照段落粒度，删除文本中的冗余信息，不改变数据条目。例如目录封面、图注表注、标注说明、尾部信息、冗余段落和参考文献等。 N-gram特征过滤用于判断文档重复度，根据特征N值计算文档

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。数据合成利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
管理加工后的数据集 - 盘古大模型 PanguLargeModels

及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看加工后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。在“操作记录”页签可以查看数据集所经历的操作及状态等信息。单击操作列的“删除”，可删除不需要的数据集。如果需

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
如何查看预置模型的历史版本 - 盘古大模型 PanguLargeModels

ModelArts Studio平台支持查看预置模型的多个历史版本，并提供对历史版本进行训练等操作的功能。您还可以查看每个版本的操作记录、状态以及其他基础信息。要查看预置模型的历史版本，您可以按照以下步骤操作：进入平台的“空间资产 > 模型 > 预置”页面。在该页面中，单击所需的模型，即可查看历史版本及相关操作记录。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
管理发布后的数据集 - 盘古大模型 PanguLargeModels

及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看发布后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。在“操作记录”页签可以查看数据集所经历的操作及状态等信息。单击操作列的“删除”，可删除不需要的数据集。如果需

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
典型问题 - 盘古大模型 PanguLargeModels

典型问题在构建和运行多语言文本翻译工作流时，可能会遇到的常见典型问题如下：问题一：文本翻译插件运行失败，报错信息如图1。图1 文本翻译插件运行失败可能原因：调用文本翻译API的Token错误或失效。解决方法：参考创建多语言文本翻译插件，重新获取Token并进行试运行。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
数据工程使用流程 - 盘古大模型 PanguLargeModels

高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。数据工程操作流程见图1、表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
应用介绍 - 盘古大模型 PanguLargeModels

知识型Agent：以大模型为任务执行核心，适用于文本生成和文本检索任务，如搜索问答助手、代码生成助手等。用户通过配置Prompt、知识库等信息，使得大模型能够自主规划和调用工具。优点：零代码开发，对话过程智能化。缺点：大模型在面对复杂的、长链条的流程时可能会受到输入长度限制，难以有效处理较为复杂的工作流。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
编排工作流 - 盘古大模型 PanguLargeModels

新性；降低温度，会使输出内容更加遵循指令要求，但同时也会减少模型输出的多样性。意图配置意图1 配置相关意图关键字信息。在意图输入框中输入意图描述信息，描述信息为针对该类别的描述语句或者关键词，也将作为大模型进行推理和分类的依据。意图数量为2 ~ 5个。高级配置提示词高

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
成长地图 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护？训练智能客服系统大模型需考虑哪些方面？如何调整训练参数，使盘古大模型效果最优？如何判断盘古大模型训练状态是否正常？为什么微调后的盘古大模型总是重复相同的回答？盘古大模型是否可以自定义人设？更多大模型概念类如何对盘古大模型的安全性展开评估和防护？

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

块、中控模块、检索模块和问答模块组成： query改写模块：针对多轮对话中经常出现的指代和信息省略问题，对用户输入的query做改写，将指示代词替换为实体词，并补充省略的context信息。基于改写后的query，再去调用中控模块以及检索模块，以便能够更好地检索出相关文档。中控

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

标变量）。 Pangu-Predict-Table-Anom-2.0.0 该模型属于异常检测模型，用于识别数据集中的异常或离群点，常应用于安全、质量控制等领域。矿山行业：进行设备故障检测，例如监控设备运行数据，识别异常行为，防止设备故障。电力行业：进行电网异常检测，例如监控电

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
数据工程 - 盘古大模型 PanguLargeModels

提升数据运维和数据治理的效率，帮助用户更好地对数据进行追根溯源。另外平台还提供了完善的标签体系、支持数据按行业标准进行分类、按行业标准进行安全分级、内置场景分类标签。帮助用户进行数据分类、数据质量控制和数据资产管理，提升数据治理的效率和效果。通过整合上述功能，数据工程在AI研发

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

填写“数据集名称”和“描述”，可选择填写“拓展信息”。拓展信息包括“数据集属性”与“数据集版权”：数据集属性。可以给数据集添加行业、语言和自定义信息。数据集版权。训练模型的数据集除用户自行构建外，也可能会使用开源的数据集。数据集版权功能主要用于记录和管理数据集的版权信息，确保数据的使用合法合规，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
查询推理作业详情 - 盘古大模型 PanguLargeModels

input TaskInputDto object 输入数据的信息。 output TaskOutputDto object 输出数据的信息。 config TaskConfigDto object 科学计算大模型配置信息。表3 TaskInputDto 参数参数类型描述 type

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 海洋模型
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

填空：从段落随机掩盖一个或多个词语、句子、段落，再将段落完形填空。若您的无监督文档没有任何结构化信息，可以将有监督的问题设置为“以下的文章中有一些词语/句子/段落缺失，文章如下：xxx。请结合文章内容，将缺失的信息补充完整。”，再将回答设置为符合要求的信息。使用规则构建的优点是快速且成本低，缺点是数据多样性较低。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
Agent开发 - 盘古大模型 PanguLargeModels

ocx、pptx、pdf等），方便导入至知识，为Agent应用提供个性化数据支持。平台还提供全链路信息观测和调试工具，支持开发者深入分析Agent执行过程中的每个环节。通过对信息进行分层展示，帮助开发者优化AI应用的性能和稳定性，确保应用在不同环境下的顺畅运行。对于低码开发者（具有一定代码开发经验的用户）：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能

总条数： 118

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

如何查看预置模型的历史版本 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

典型问题 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

应用介绍 - 盘古大模型 PanguLargeModels

编排工作流 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

查询推理作业详情 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

Agent开发 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线