搜索_华为云

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

表1 预测大模型与数据集类型对应关系基模型模型分类数据集内容文件格式预测大模型时序预测模型时序数据 csv 回归模型异常检测模型分类模型回归分类数据 csv 训练预测大模型所需数据量训练预测大模型时，所需的数据通常为表格格式，即由行和列组成的扁平化数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

物体检测数据集标注文件说明该说明适用于表1中的物体检测标注文件格式。物体检测数据集支持格式为ModelArts PASCAL VOC 1.0。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
查看预测大模型训练状态与指标 - 盘古大模型 PanguLargeModels

数值越高，表明模型在检测正类样本时的准确性越高。召回率召回率是指在所有实际为正类的样本中，被模型正确预测为正类的比例。数值越高，表明模型在检测正类样本时的全面性越高。获取训练日志单击训练任务名称，可以在“日志”页面查看训练过程中产生的日志。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

Pangu-Predict-Table-Anom-2.0.0 该模型属于异常检测模型，用于识别数据集中的异常或离群点，常应用于安全、质量控制等领域。矿山行业：进行设备故障检测，例如监控设备运行数据，识别异常行为，防止设备故障。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

适用于各种任务，如：积水检测、占道经营检测、人员离岗检测、动植物检测、工业缺陷检测等。 2024年12月发布的版本，支持全量微调、在线推理。物体检测-N模型为中参数量模型，在保证计算效率的同时，具备较强的特征识别能力，提供高效的性能表现。父主题：训练CV大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

基模型算法池对于异常检测模型：从预定义的算法池中选择用于训练模型的算法，算法包括：["knn", "iforest", "loda", "oc"]，其中： knn表示k最近邻算法。 iforest表示孤立森林算法。 loda表示Loda算法。 oc表示单类支持向量机算法。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
查看CV大模型训练状态与指标 - 盘古大模型 PanguLargeModels

数值越高，表明模型在检测正类样本时的准确性越高。召回率召回率是指在所有实际为正类的样本中，被模型正确预测为正类的比例。数值越高，表明模型在检测正类样本时的全面性越高。获取训练日志单击训练任务名称，可以在“日志”页面查看训练过程中产生的日志。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

事件检测视频+json 数据源样本为avi、mp4格式，标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

锚框的长边和短边的比例定义检测物体锚框的长宽比。通过设置不同的长短比例，模型可以更好地适应多种尺寸和形状的物体。锚框大小指锚框的初始尺寸。锚框是物体检测中的一个关键概念，通过合理设置，可以帮助模型检测出多种尺寸的目标。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

表1 训练CV大模型数据集类型要求基模型训练场景文件内容文件格式盘古-CV-物体检测-N 微调图片+检测标注图片+xml 训练CV大模型所需数据量初期启动训练时，每种模型类别先提供1000张已标注的图片数据进行训练，后续根据验证结果再动态提供数据迭代。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

敏感词过滤对文本中涉及黄色、暴力、政治等敏感数据进行自动检测和过滤。文本长度过滤按照设置的文本长度，保留长度范围内的数据进行。冗余信息过滤按照段落粒度，删除文本中的冗余信息，不改变数据条目。例如目录封面、图注表注、标注说明、尾部信息、冗余段落和参考文献等。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
什么是盘古大模型 - 盘古大模型 PanguLargeModels

通过提供自动化的质量检测和数据清洗能力，对原始数据进行优化，确保其质量和一致性。同时，数据工程工具链还提供强大的数据存储和管理能力，为大模型训练提供高质量的数据支撑。模型开发工具链模型开发工具链是盘古大模型服务的核心组件，提供从模型创建到部署的一站式解决方案。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

query改写模块来源：互联网开源数据集问答模块来源一：互联网开源数据集，如政府网站网页、政府在线问答公开数据、政务百科等。来源二：特定的私域数据，针对于具体场景和项目需求，收集相关的文本数据。比如通过与当地政府的政数局进行合作，获取政府部门提供的内部脱敏数据等。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
Agent开发平台介绍 - 盘古大模型 PanguLargeModels

Agent开发平台应用场景当前，基于Agent开发平台可以构建两种类型的应用，一种是针对文本生成、文本检索的知识型Agent，如搜索问答助手、代码生成助手等，执行主体在大模型；另一种是针对复杂工作流场景的流程型Agent，如金融分析助手、网络检测助手等。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
数据工程介绍 - 盘古大模型 PanguLargeModels

QA对格式支持：jsonl 物体检测图片格式支持：jpg、jpeg、png、bmp 标注格式支持：xml 图像分类图片格式支持：jpg、jpeg、png、bmp 标注格式支持：txt 异常检测图片格式支持：jpg、jpeg、png、bmp 标注格式支持：txt 语义分割 jpg

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
功能总览 - 盘古大模型 PanguLargeModels

通过提供自动化的质量检测和数据清洗能力，对原始数据进行优化，确保其质量和一致性。同时，数据工程工具链还提供强大的数据存储和管理能力，为大模型训练提供高质量的数据支撑。

帮助中心 > 盘古大模型 PanguLargeModels > 功能总览

总条数： 16

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

查看预测大模型训练状态与指标 - 盘古大模型 PanguLargeModels

预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

查看CV大模型训练状态与指标 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

Agent开发平台介绍 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

功能总览 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线