自动驾驶云服务 Octopus-音频标注数据集文件说明:标注数据.json文件说明

时间:2025-01-26 10:38:04

标注数据.json文件说明

数据集中必含“.json”文件,用于集合该音频文件的所有标注数据信息,包括该音频所在的项目id、数据包id、音频上所有标注信息等。上传数据集前请保证“.json”文件内容正确。“.json”文件编写的参考样例如下:

{  "frame_id": 1,  #帧序号  "batch_task_id": 1368,  #批次任务id  "project_id": "ee263479089143cf9d8ca66a10ed3c3d",  #资源域ID  "label_mode": "manual",  #标注类型:auto和manual两种   "status": "labeled",  #标注任务状态:unlabeled、labeled、unconfirmed、confirmed、all五种    "sample_type": "AUDIO",  #样本类型:包含“IMAGE”,“POINT_CLOUD”,“AUDIO”,“TEXT”  "des_order": "",  #此份数据对应的原始数据包描述  "tag_names": [],  #标签名称  "valid": true,  #是否有效,包含“true”和“false”两种  "create_time": 1708657733087,  #标注的创建时间  "difficult": false,  #是否难例,包含“true”难例和“false”非难例  "label_counts": [  #各类标注物的个数统计    {      "label_meta_id": 7900,      #标注物使用的标签ID      "label_num": 1,      #标注物个数      "label_meta_name": "奇怪的声音1",      #标注物名称      "label_meta_desc": "1233",      #标注物描述      "label_meta_attr": "{\"声音1\":\"2333,4444\",\"声音2\":\"334455,1121333\"}",      #标注物额外属性      "label_meta_shape": "audio",      #标注物形状,包含“bndbox、line、circle、polygon、points、dashed、cube_3d、multiBox、polygon_3d_v2、audio、text”      "label_meta_color": "#496832",      #标注物颜色信息      "level": 0    },    {      "label_meta_id": 7901,      "label_num": 1,      "label_meta_name": "噪声",      "label_meta_desc": "11",      "label_meta_attr": "{\"text1\":\"111,222,333\",\"额鹅鹅鹅\":\"1111,333\"}",      "label_meta_shape": "audio",      "label_meta_color": "#391c1c",      "level": 0    }  ],  "audio_meta_info": {   #音频信息    "id": "4951cbcb-57ea-4367-b0e2-56b77a18e9bd",    "name": "0000.mp3",    #音频名称    "source": "https://octopus-raw-ee263479089143cf9d8ca66a10ed3c3d.obs.cn-north-5.myhuaweicloud.com/label-data/task-1368/data/mp3/0000.mp3",    #音频源的obs路径url    "duration": "180.0s"    #音频时长  },  "label_task_id": 1691,   #批次子任务ID  "partitionId": 20240222,  "label_update_time": 1708944569975,   #标注最近更新时间   "prefix_folder": "mp3",  "image_id": "889b33fa-8c43-4760-a215-14d299af4291",  "inspection": 0,  "labels": [    {      "label_meta_id": 7900,       #标注物对应的标签ID        "create_time": 0,      "shape_type": "audio",      #标注物形状      "serial_number": 1,      #该帧中标注物唯一自增id      "label_object_id": -1,      "attribute": "{\"声音1\":\"2333\"}",      #标注物属性      "audio": {      #音频子段落标注信息        "xmin": 48.957073,        #段落开始时间        "xmax": 80.938614,        #段落结束时间        "gender": "MALE",        #讲话人性别, 允许不存在此字段        "author": "role1",        #讲话人角色, 允许不存在此字段        "text": "aaaaabbb"        #音频对应的文本      },      "label_meta_name": "奇怪的声音1"      #标注物名称    },    {      "label_meta_id": 7901,      "create_time": 0,      "shape_type": "audio",      "serial_number": 2,      "label_object_id": -1,      "attribute": "{}",      "audio": {        "xmin": 126.331764,        "xmax": 138.0552      },      "label_meta_name": "噪声"    }  ]}
support.huaweicloud.com/usermanual-octopus/octopus-04-0045.html