语音交互服务 SIS-录音文件极速版:请求参数

时间:2024-10-11 09:55:42

请求参数

请求类为FlashLasrRequest,详见表3

表3 FlashLasrRequest

参数

是否必选

参数类型

描述

audio_format

String

支持语音的格式,请参考表4

property

String

所使用的模型特征串,通常是 “语种_采样率_领域”的形式,采样率需要与音频采样率保持一致,取值范围请参考表5

add_punc

String

表示是否在识别结果中添加标点,取值为“yes”“no”,默认为“no”

digit_norm

String

表示是否将语音中的数字识别为阿拉伯数字,取值为“yes”“no”,默认为“yes”

vocabulary_id

String

热词表id,不使用则不填写。

创建热词表信息请参考创建热词表

need_word_info

String

表示是否在识别结果中输出分词结果信息,取值为“yes”“no”,默认为“no”

first_channel_only

String

表示是否在识别中只识别首个声道的音频数据,取值为“yes”“no”,默认为“no”

obs_bucket_name

String

表示在OBS对象桶名,使用前请先授权,操作方法请参见配置OBS访问权限。obs_bucket_name长度大于等于3个字符,小于64个字符,不需要进行urlencode编码,如果包含中文,直接输入中文即可。

示例

obs url为https://test.obs.cn-north-4.myhuaweicloud.com/data/0601/test.wav

则obs_bucket_name=test,obs_bucket_key=data/0601/test.wav

obs_object_key

String

表示OBS对象桶中的对象的键值,长度小于1024个字符,不需要进行urlencode编码,如果包含中文,直接输入中文即可。

示例

obs url为https://test.obs.cn-north-4.myhuaweicloud.com/data/0601/test.wav

则obs_bucket_name=test,obs_bucket_key=data/0601/test.wav

表4 audio_format

audio_format取值

描述

wav

wav格式音频

mp3

mp3格式音频

m4a

m4a格式音频

aac

aac格式音频

opus

ops格式音频。

表5 property

property取值

描述

chinese_8k_common

支持采样率为8k的中文普通话 语音识别

chinese_16k_conversation

支持采样率为16k的会议场景的中文普通话语音识别。

support.huaweicloud.com/sdkreference-sis/sis_05_0067.html