搜索_华为云

事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

事件响应服务器端检测到某些事件时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为EVENT，表示开始识别响应。 trace_id String 服

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
一句话识别Websocket接口 - 语音交互服务 SIS

详见api文档 /** * 一句话识别websocket版本参数设置，所有参数设置均为可选，均有默认值。用户根据需求设置参数。 * * @param request request请求，包含各种参数 */ private void setParamete

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式前提条件确保已经按照配置好iOS开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RASRClient，参数为AuthInfo和RASRConfig。表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
发送音频数据 - 语音交互服务 SIS

message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，建议在需要实时反馈的情况下100ms，不需要实时反馈的情况下500ms。实时语音识别代码示例请参考SDK文档。当前SIS服务对于8k音频的分片大小限制为[160

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别 - 语音交互服务 SIS

项目ID，同region一一对应，参考获取项目ID。请求参数请求类为SASRConfig和语音数据data，详见表2。表2 SASRConfig 参数名称是否必选参数类型描述 config 是 Config object 配置信息。 data 是 String 本地音频文件经

 帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

请求什么类型的操作。 GET：请求服务器返回指定资源。 PUT：请求服务器更新指定资源。 POST：请求服务器新增资源或执行特殊操作。 DELETE：请求服务器删除指定资源，如删除对象等。 HEAD：请求服务器资源头部。 PATCH：请求服务器更新资源的部分内容。当资源不存在的时

 帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
识别结果响应 - 语音交互服务 SIS

当服务端识别出结果后会实时向客户端按句推送识别结果响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为RESULT，表示识别结果响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
有哪些途径可以使用语音交互的API - 语音交互服务 SIS

息。cURL适用于接口调试。关于cURL详细信息请参见https://curl.haxx.se/。编码通过编码调用接口，组装请求消息，并发送处理请求消息。 REST客户端 Mozilla、Google都为REST提供了图形化的浏览器插件，发送处理请求消息。下载postman请参见https://www

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别连续模式 - 语音交互服务 SIS

客户端的端点检测功能相结合，只将检测到的有效语音段上传到服务器进行识别。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/continue-stream 参数说明表1 参数说明参数名是否必选说明 project_id 是项目编号。获取方法，请参见获取项目ID。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto 自动判断，系统会自动判断并支持

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
时间戳数据 - 语音交互服务 SIS

用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为RESULT。 trace_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
一句话识别Websocket接口 - 语音交互服务 SIS

初始化SasrWebsocketClient详见表 SasrWebsocketClient初始化参数。表1 SasrWebsocketClient初始化参数参数名称是否必选参数类型描述 ak 是 String 用户的ak，请参考AK/SK认证。 sk 是 String 用户的sk，请参考AK/SK认证。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
调用Java SDK实现一句话识别 - 语音交互服务 SIS

项目ID，同Region一一对应，参考获取项目ID。 Endpoint 可选终端节点，可不填，使用默认即可。表2 config配置参数参数名称是否必选参数说明 SocketTimeout 可选 Socket超时，默认10000，单位ms。 ConnectionTimeout 可选

 帮助中心 > 语音交互服务 SIS > 快速入门
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
Websocket握手请求 - 语音交互服务 SIS

wss-URI格式 wss /v1/{project_id}/rtts 参数说明表1 参数说明名称是否必选说明 project_id 是项目编号。获取方法，请参见获取项目ID。表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String 表示客户端发送开始识别请求，参数值需设置为START。 config 是 Object 配置信息。结构信息请参见表 config数据结构。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求

总条数： 112

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

事件响应 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

有哪些途径可以使用语音交互的API - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

Websocket握手请求 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线