搜索_华为云

实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音识别 - 语音交互服务 SIS

实时语音识别支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
实时语音识别 - 语音交互服务 SIS

选择连接模式，目前实时语音识别提供三种接口，流式一句话、实时语音识别连续模式、实时语音识别单句模式 // 选择1 流式一句话连接 // rasrClient.shortStreamConnect(request); // 选择2，实时语音识别单句模式

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
实时语音识别响应 - 语音交互服务 SIS

实时语音识别响应开始识别请求响应事件响应识别结果响应错误响应严重错误响应结束识别请求响应父主题：实时语音识别接口

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
实时语音识别接口 - 语音交互服务 SIS

实时语音识别接口接口说明 Websocket握手请求实时语音识别请求实时语音识别响应

 帮助中心 > 语音交互服务 SIS > API参考
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
使用实时语音识别 - 语音交互服务 SIS

方法名称是否必选参数类型描述 SetPunc 否 String 表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 SetDigitNorm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 SetVadHead 否

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
实时语音识别请求 - 语音交互服务 SIS

实时语音识别请求实时语音识别工作流程开始识别发送音频数据结束识别父主题：实时语音识别接口

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

支持采样率为16k的中文普通话语音识别，采用新一代端到端识别算法，识别准确率更高。区域支持cn-east-3和cn-north-4（强烈推荐使用）。 english_16k_general 支持采样率为16k的英语语音识别，采用新一代端到端识别算法，识别准确率更高。区域仅支持cn-

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成功能介绍语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > 产品介绍
发送音频数据 - 语音交互服务 SIS

馈的情况下500ms。实时语音识别代码示例请参考SDK文档。当前SIS服务对于8k音频的分片大小限制为[160, 32768]字节, 16k音频的分片大小限制为[320, 65536]字节, 分片大小超出上限或低于下限会报错。父主题：实时语音识别请求

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

是 String 表示客户端结束识别请求，参数值设置为END。 cancel 否 Boolen 是否取消返回识别结果。 true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
识别结果响应 - 语音交互服务 SIS

Object 调用成功表示识别结果，调用失败时无此字段。请参考表 result数据结构。表3 result数据结构参数名参数类型说明 text String 识别结果。 score Float 识别结果的置信度，取值范围：0~1。此值会在实时识别中不断刷新，直到返回最终结果。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
错误响应 - 语音交互服务 SIS
错误响应 - 语音交互服务 SIS

下情况：配置串错误，包括存在不识别的配置串，或者配置串值的范围不合法。时序不正确，比如连续发送两次“开始识别”指令。识别过程中发生错误，比如音频解码发生错误。出现错误响应时，如果已经在一个会话中了，会再发送一个“结束识别”的响应，表示识别会话结束。如果会话还没有开始，那么

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

D、EXCEEDED_SILCENCE事件。在实时语音识别单句模式下：返回VOICE_START事件，表示检测到语音，此时IVR可以做打断。返回VOICE_END事件后，表示一句话结束，后续的音频将被忽略，不会再进行识别。只会返回最多一组VOICE_START和VOICE_END事件。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应

总条数： 117

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别响应 - 语音交互服务 SIS

实时语音识别接口 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

实时语音识别请求 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

错误响应 - 语音交互服务 SIS

事件响应 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线