搜索_华为云

录音文件识别 - 语音交互服务 SIS

录音文件识别前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
一句话识别Http接口 - 语音交互服务 SIS

一句话识别Http接口前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化A

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
一句话识别 - 语音交互服务 SIS

一句话识别支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
一句话识别 - 语音交互服务 SIS

一句话识别 http接口 websocket接口

 帮助中心 > 语音交互服务 SIS > API参考
实时语音识别 - 语音交互服务 SIS

实时语音识别前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient详见表

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

的值。如果检测语音结尾的静音时长大于等于此值时，在实时语音识别单句模式下将返回VOICE_END（识别结果非空）或EXCEEDED_SILENCE（识别结果为空）事件并结束识别，在连续模式下将会断句并继续下一句的识别。取值范围：[0, 3000]的整数，单位为ms，默认为500ms。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别Websocket接口 - 语音交互服务 SIS

一句话识别Websocket接口前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。该功能为1.70及以上版本SDK新增功能，使用前请检查并更新SDK版本。请

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > 语音交互服务 SIS > API参考
录音文件识别接口 - 语音交互服务 SIS

录音文件识别接口提交录音文件识别任务获取录音文件识别结果

 帮助中心 > 语音交互服务 SIS > API参考
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音识别连续模式 - 语音交互服务 SIS

段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次返回识别结果。如果送入的一段语音较长，甚至有可能在一次返回中包括了多段的识别结果。由于引入了静音检测，连续识别模式通常会比流式识别能具有更高的效率，因为对于静音段将不会

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
使用实时语音识别 - 语音交互服务 SIS

音频格式，支持pcm等，如pcm8k16bit，参见《API参考》中开始识别章节。 property 是 String 属性字符串，language_sampleRate_domain，如chinese_8k_common，参见《API参考》中开始识别章节。通过set方法可以设置具体参数，详见表 RasrRequest设置参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

是 String 表示客户端结束识别请求，参数值设置为END。 cancel 否 Boolen 是否取消返回识别结果。 true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别响应 - 语音交互服务 SIS

实时语音识别响应开始识别请求响应事件响应识别结果响应错误响应严重错误响应结束识别请求响应父主题：实时语音识别接口

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
识别结果响应 - 语音交互服务 SIS

Object 调用成功表示识别结果，调用失败时无此字段。请参考表 result数据结构。表3 result数据结构参数名参数类型说明 text String 识别结果。 score Float 识别结果的置信度，取值范围：0~1。此值会在实时识别中不断刷新，直到返回最终结果。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应

总条数： 130

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

录音文件识别 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别接口 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

实时语音识别响应 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线