语音交互服务 SIS-录音文件识别:请求参数

时间:2024-12-04 10:03:55

请求参数

请求类为AsrCustomLongRequest,详见表3

表3 AsrCustomLongRequest

参数名称

是否必选

参数类型

描述

data_url

String

存放录音文件地址:

  • 推荐使用华为云OBS:授权配置请参见OBS配置
  • 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用 域名 ,请尽量避免中文

audio_format

String

音频格式,具体信息请参见《API参考》中录音文件识别章节。

model_property

String

属性字符串,语言_采样率_模型,如chinese_8k_common。具体信息请参见《API参考》中录音文件识别章节。

add_punc

String

表示是否在识别结果中添加标点,取值为yes 、 no,默认no。

digit_norm

String

表示是否将语音中的数字识别为阿拉伯数字,取值为yes 、 no,默认为yes。

need_analysis_info

Boolean

是否选择分析信息。

如果选择false,则声道、话者分离、情绪检测、速度信息均无效。默认false。

diarization

Boolean

是否需要话者分离,表示识别结果会包含role项,默认true。

channel

String

语音文件声道信息,可以为MONO(缺省), LEFT_AGENT, RIGHT_AGENT。默认MONO。

emotion

Boolean

是否需要做情绪检测,默认true。

speed

Boolean

是否需要输出语速信息,默认true。

vocabulary_id

String

热词表id,不使用则不填写。

创建热词表请参考《API参考》中创建热词表章节。

word_info

Array of objects

分词信息列表。

support.huaweicloud.com/sdkreference-sis/sis_05_0052.html