搜索_华为云

开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
SDK（websocket） - 语音交互服务 SIS

SDK（websocket）下载SDK包语音交互SDK软件包获取请参见表下载SDK包。示例音频参见示例音频。当您使用过旧版本的Java SDK时，需要注意旧版本的SDK依赖的jar包与新版本SDK的jar包有无冲突。新版本SDK升级日志为log4j2，同时java-sdk-core升级到3

帮助中心 > 语音交互服务 SIS > SDK参考
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

应用场景语音客服质检识别客服、客户的语音，转换为文本。进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录。语音短消息通过语音发送或者接收短消息时，将音频短消息转文字，提升阅读效率和交互体验。

帮助中心 > 语音交互服务 SIS > 产品介绍
错误响应 - 语音交互服务 SIS
错误响应 - 语音交互服务 SIS

错误响应错误响应，通常是指不影响流程，但当前会话无法再进行下去的错误，包括如下情况：配置串错误，包括存在不识别的配置串，或者配置串值的范围不合法。时序不正确，比如连续发送两次“开始识别”指令。识别过程中发生错误，比如音频解码发生错误。出现错误响应时，如果已经在一个会话中

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
实时语音识别请求 - 语音交互服务 SIS

实时语音识别请求实时语音识别工作流程开始识别发送音频数据结束识别父主题：实时语音识别接口

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

事件响应服务器端检测到某些事件时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为EVENT，表示开始识别响应。 trace_id String 服

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
实时语音识别 - 语音交互服务 SIS

实时语音识别前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient详见表

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
实时语音识别 - 语音交互服务 SIS

实时语音识别支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音识别 - 语音交互服务 SIS

实时语音识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient，其参数包括AuthInfo、RasrListener、SisConfig。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
获取录音文件识别结果 - 语音交互服务 SIS

获取录音文件识别结果功能介绍该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果每个用户独立建立websocket连接，不可共用一个websocket连接。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
录音文件识别 - 语音交互服务 SIS

录音文件识别支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
录音文件识别 - 语音交互服务 SIS

录音文件识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。请参考SDK（websocket）获取最新版本SDK包。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
使用实时语音识别 - 语音交互服务 SIS

使用实时语音识别前提条件确保已按照配置CPP环境（Linux）配置完毕。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient，其参数包括AuthInfo 表1 AuthInfo 参数名称是否必选参数类型描述 ak 是

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
录音文件识别 - 语音交互服务 SIS

录音文件识别前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK

总条数： 111

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开始识别请求响应 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

错误响应 - 语音交互服务 SIS

实时语音识别请求 - 语音交互服务 SIS

事件响应 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线