语音交互服务 SIS-录音文件识别极速版接口:URI

时间:2024-05-08 15:27:54

URI

POST /v1/{project_id}/asr/flash

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

项目编号。获取方法,请参见获取项目ID

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。

用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。

Enterprise-Project-Id

String

企业项目ID。SIS支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。

获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。

企业项目创建步骤请参见用户指南。

说明:

账户创建企业项目后,在传参时,有以下三类场景。

  • 携带正确的ID,正常使用SIS服务,账单归到企业ID对应的企业项目中。
  • 携带错误的ID,正常使用SIS服务,账单的企业项目会被分类为“default”。
  • 不携带ID,正常使用SIS服务,账单的企业项目会被分类为“default”。

表3 Query参数

参数

是否必选

参数类型

描述

audio_format

String

支持语音的格式,请参考表 audio_format取值范围

property

String

所使用的模型特征串,通常是 “语种_采样率_领域”的形式,采样率需要与音频采样率保持一致,取值范围请参考表 property取值范围

obs_bucket_name

String

表示在OBS对象桶名,使用前请先授权配置请参见配置OBS访问权限。obs_bucket_name字符长度区间为[3,64),需要进行urlencode编码。

OBS桶区域需要与接口的地址区域一致。

示例:

obs url为https://sis-audio-cn4.obs.cn-north-4.myhuaweicloud.com/abc/16k_pcm.wav

则obs_bucket_name值为sis-audio-cn4,obs_object_key值为abc/16k_pcm.wav。如果上传至OBS桶中的文件或OBS路径为中文,obs_object_key的值需要采用中文形式。

obs_object_key

String

表示OBS对象桶中的对象的键值,长度小于1024个字符,需要进行urlencode编码。

OBS桶区域需要与接口的地址区域一致。

示例:

obs url为https://sis-audio-cn4.obs.cn-north-4.myhuaweicloud.com/abc/16k_pcm.wav

则obs_bucket_name=sis-audio-cn4,obs_object_key=abc/16k_pcm.wav

add_punc

String

表示是否在识别结果中添加标点,取值为“yes”“no”,默认为“no”

digit_norm

String

表示是否将语音中的数字识别为阿拉伯数字,取值为“yes”“no”,默认为“yes”

need_word_info

String

表示是否在识别结果中输出分词结果信息,取值为“yes”“no”,默认为“no”

first_channel_only

String

表示是否在识别中只识别首个声道的音频数据,取值为“yes”“no”,默认为“no”

说明:

如果音频数据为多声道,参数取默认值no时,会叠加计费。例如,双声道收费为双倍。

表4 audio_format取值范围

audio_format取值

描述

wav

wav格式音频。

mp3

mp3格式音频。

m4a

m4a格式音频。

acc

acc格式音频。

opus

opus格式音频。

表5 property取值范围

property取值

描述

chinese_8k_common

支持采样率为8k的中文普通话 语音识别

chinese_16k_conversation

支持采样率为16k的会议场景的中文普通话语音识别。

support.huaweicloud.com/api-sis/sis_03_0090.html