语音交互服务 SIS-实时语音识别:请求参数

时间:2024-10-11 09:55:42

请求参数

请求类为RasrRequest,详见表3

表3 RasrRequest

参数名称

是否必选

参数类型

描述

audio_format

String

音频格式,支持pcm,alaw,ulaw等,如pcm8k16bit,参见《API参考》中开始识别章节。

model_property

String

属性字符串,language_sampleRate_domain, 如chinese_16k_general,参见《API参考》中开始识别章节。

add_punc

String

表示是否在识别结果中添加标点,取值为yes 、 no,默认no。

digit_norm

String

表示是否将语音中的数字识别为阿拉伯数字,取值为yes 、 no,默认为yes。

vad_head

Integer

头部最大静音时间,[0, 60000],默认10000ms。

vad_tail

Integer

尾部最大静音时间,[0, 3000],默认500ms。

max_seconds

Integer

音频最长持续时间, [1, 60],默认30s。

interim_results

String

是否显示中间结果,yes 或 no,默认no。例如分3次发送音频,选择no结果一次性返回,选择yes分三次返回。

vocabulary_id

String

热词表id,若没有则不填。

need_word_info

String

表示是否在识别结果中输出分词结果信息,取值为“yes”“no”,默认为“no”

support.huaweicloud.com/sdkreference-sis/sis_05_0053.html