搜索_华为云

开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

开始识别功能介绍当wss握手请求收到成功响应后，客户端到服务端的通信协议会升级为Websocket协议。通过Websocket协议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别Websocket接口 - 语音交互服务 SIS

一句话识别Websocket接口前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。该功能为1.70及以上版本SDK新增功能，使用前请检查并更新SDK版本。请参考SDK（websocket）获取最新版本SDK包。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成结果响应 - 语音交互服务 SIS

语音合成结果响应音频流数据时间戳数据父主题：实时语音合成响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音合成结束响应 - 语音交互服务 SIS

语音合成结束响应功能介绍当合成引擎处理完合成请求后，会发送合成结束响应。客户端收到该响应后关闭当前Websocket链接即可。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为END，表示语音合成结束。 trace_id String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音合成错误响应 - 语音交互服务 SIS

语音合成错误响应功能介绍合成引擎处理合成请求时如果发生错误则返回该响应。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为ERROR，表示错误响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
一句话识别(websocket版) - 语音交互服务 SIS

一句话识别(websocket版) 前提条件确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SasrWsClient，其中参数包含AuthInfo，SisHttpConfig，SasrWsRespo

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
有哪些途径可以使用语音交互的API - 语音交互服务 SIS

有哪些途径可以使用语音交互的API 共有三种方式可以基于已构建好的请求消息发起请求。 cURL cURL是一个命令行工具，用来执行各种URL操作和信息传输。cURL充当的是HTTP客户端，可以发送HTTP请求给服务端，并接收响应消息。cURL适用于接口调试。关于cURL详细信息请参见https://curl

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' 充值后需要等待1min后才能进行调用。如果使用token进行调用api（非ak/sk），需要在充值后重新获取token，再进行调用。父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类

总条数： 216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开始识别 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

语音合成结果响应 - 语音交互服务 SIS

语音合成结束响应 - 语音交互服务 SIS

语音合成错误响应 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

一句话识别(websocket版) - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

有哪些途径可以使用语音交互的API - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线