AI开发平台MODELARTS-创建数据集:数据集统计信息可视化

时间:2024-05-11 08:28:52

数据集统计信息可视化

数据集API支持自动统计数据集信息,比如目标、尺寸等信息,帮助用户更好的理解数据集,同时还可以动态查看每一个batch经过pipeline之后的输入图像,确保数据增强的正确性。

db.plot_dataset_stats() 可以绘制数据集的统计信息,图像的显示大小可以由figsize参数控制;
db.print_dataset_stats() 能够打印出具体的统计信息数值;
db.show_batch() 可以动态展示内存中的经过增强后的图片信息,可以通过rows(显示行数)和figsize(显示大小)来控制输出。

注:show_batch返回一个生成器,可以使用next进行访问,比如:

plotter = db.show_batch(rows=2, figsize=(14, 8))
next(plotter)
表2 show_batch参数说明

参数名称

可选/必选

参数类型

参数描述

rows

可选

int

batch绘制行数,默认为1

figsize

可选

tuple

画布尺寸

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0219.html