语音交互服务 SIS-录音文件识别:请求参数

时间：2024-12-04 10:03:55

语音交互服务 SIS

请求类为AsrCustomLongRequest，详见表3。

表3 AsrCustomLongRequest
参数名称	是否必选	参数类型	描述
data_url	是	String	存放录音文件地址：推荐使用华为云OBS：授权配置请参见OBS配置。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文
audio_format	是	String	音频格式，具体信息请参见《API参考》中录音文件识别章节。
model_property	是	String	属性字符串，语言_采样率_模型，如chinese_8k_common。具体信息请参见《API参考》中录音文件识别章节。
add_punc	否	String	表示是否在识别结果中添加标点，取值为yes 、 no，默认no。
digit_norm	否	String	表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。
need_analysis_info	否	Boolean	是否选择分析信息。如果选择false，则声道、话者分离、情绪检测、速度信息均无效。默认false。
diarization	否	Boolean	是否需要话者分离，表示识别结果会包含role项，默认true。
channel	否	String	语音文件声道信息，可以为MONO（缺省), LEFT_AGENT， RIGHT_AGENT。默认MONO。
emotion	否	Boolean	是否需要做情绪检测，默认true。
speed	否	Boolean	是否需要输出语速信息，默认true。
vocabulary_id	否	String	热词表id，不使用则不填写。创建热词表请参考《API参考》中创建热词表章节。
word_info	否	Array of objects	分词信息列表。