语音交互服务 SIS-实时语音识别:请求参数

时间：2024-10-11 09:55:42

语音交互服务 SIS Python SDK

请求类为RasrRequest，详见表3。

表3 RasrRequest
参数名称	是否必选	参数类型	描述
audio_format	是	String	音频格式，支持pcm，alaw，ulaw等，如pcm8k16bit，参见《API参考》中开始识别章节。
model_property	是	String	属性字符串，language_sampleRate_domain，如chinese_16k_general，参见《API参考》中开始识别章节。
add_punc	否	String	表示是否在识别结果中添加标点，取值为yes 、 no，默认no。
digit_norm	否	String	表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。
vad_head	否	Integer	头部最大静音时间，[0, 60000]，默认10000ms。
vad_tail	否	Integer	尾部最大静音时间，[0, 3000]，默认500ms。
max_seconds	否	Integer	音频最长持续时间， [1, 60]，默认30s。
interim_results	否	String	是否显示中间结果，yes 或 no，默认no。例如分3次发送音频，选择no结果一次性返回，选择yes分三次返回。
vocabulary_id	否	String	热词表id，若没有则不填。
need_word_info	否	String	表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。