语音交互服务 SIS-获取录音文件识别结果:响应参数

时间:2024-01-16 10:15:00

响应参数

状态码: 200

表3 响应Body参数

参数

是否必选

参数类型

描述

job_id

String

录音文件识别任务标识符。

  • 使用“callback_url”回调url时,该字段会随结果发送至用户服务器。
  • 使用get接口查询,不会出现该字段。

status

String

当前识别状态。具体状态如下所示:

WAITING 等待识别。

FINISHED 识别已经完成。

ERROR 识别过程中发生错误。

create_time

String

任务创建时间,遵循 RFC 3339格式。

格式示例:2018-12-04T13:10:29.310Z。

start_time

String

开始识别时间,遵循 RFC 3339格式。

当status为FINISHED或ERROR时存在。

格式示例:2018-12-04T13:10:29.310Z。

finish_time

String

识别完成时间,遵循 RFC 3339格式。

当status为FINISHED或ERROR时存在。

格式示例:2018-12-04T13:10:29.310Z。

audio_duration

Integer

提交音频的时长,单位ms。

segments

Array of Segment objects

识别结果, 多句结果的数组。

表4 Segment

参数

是否必选

参数类型

描述

start_time

Integer

一句的起始时间戳,单位ms。

end_time

Integer

一句的结束时间戳,单位ms。

result

TranscriberResult object

调用成功表示识别结果,调用失败时无此字段。数据结构参见result表。

表5 TranscriberResult

参数

是否必选

参数类型

描述

text

String

识别结果文本。

analysis_info

AnalysisInfoResult object

每一句的质检分析结果对象。

仅在识别配置中的need_analysis_info不为null时存在该返回结果。数据结构参见analysisinfo数据表。

word_info

Array of WordInfo objects

分词输出列表。

表6 AnalysisInfoResult

参数

是否必选

参数类型

描述

role

String

角色类型,目前对于8k音频以及16k双声道音频仅支持 AGENT(座席),USER(用户)。可用于电话质检等场景。对于16k单声道音频,支持多个说话人,取值范围是(speaker1 ~ speaker10),最多支持10个说话人,可用于会议场景。

emotion

String

情绪类型,目前仅支持NORMAL(正常),ANGRY(愤怒),UNKNOWN(未知)。

在识别配置中emotion为true时存在。

speed

Float

语速信息,单位是每秒字数。

在识别配置中speed为true时存在。

表7 WordInfo

参数

是否必选

参数类型

描述

start_time

Integer

起始时间

end_time

Integer

结束时间

word

String

分词

状态码: 400

表8 响应Body参数

参数

参数类型

描述

error_code

String

调用失败时的错误码。 调用成功时无此字段。

error_msg

String

调用失败时的错误信息。 调用成功时无此字段。

support.huaweicloud.com/api-sis/sis_03_0093.html