AI开发平台MODELARTS-从Manifest文件导入规范说明:语音分割

时间:2024-08-16 20:38:57

语音分割

{
    "source":"s3://path/to/audio1.wav",
    "usage":"TRAIN",
    "annotation":[
        {
           
"type":"modelarts/audio_segmentation",
            "property":{
                "@modelarts:start_time":"00:01:10.123",
                "@modelarts:end_time":"00:01:15.456",
               
                "@modelarts:source":"Tom",
               
                "@modelarts:content":"How are you?"
            },
           "annotated-by":"human",
           "creation-time":"2019-01-23 11:30:30"
        },
        {
           "type":"modelarts/audio_segmentation",
            "property":{
                "@modelarts:start_time":"00:01:22.754",
                "@modelarts:end_time":"00:01:24.145",
                "@modelarts:source":"Jerry",
                "@modelarts:content":"I'm fine, thank you."
            },
           "annotated-by":"human",
           "creation-time":"2019-01-23 11:30:30"
        }
    ]
}
  • “source”“usage”“annotation”等参数说明与图像分类一致,详细说明请参见表1
  • “property”的参数解释如表10所示。
    表10 “property”参数说明

    参数名

    数据类型

    描述

    @modelarts:start_time

    String

    声音的起始时间,格式为“hh:mm:ss.SSS”

    其中“hh”表示小时,“mm”表示分钟,“ss”表示秒,“SSS”表示毫秒。

    @modelarts:end_time

    String

    声音的结束时间,格式为“hh:mm:ss.SSS”

    其中“hh”表示小时,“mm”表示分钟,“ss”表示秒,“SSS”表示毫秒。

    @modelarts:source

    String

    声音来源。

    @modelarts:content

    String

    声音内容。

support.huaweicloud.com/usermanual-standard-modelarts/dataprepare-modelarts-0015.html