搜索_华为云

识别结果响应 - 语音交互服务 SIS

识别结果响应服务端在收到客户端发送的连续音频数据后，当服务端识别出结果后会实时向客户端按句推送识别结果响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为RESULT

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout）问题现象超时通常是由于网络不通造成的，需要对网络环境和代码进行具体分析。解决方案检查网络是否正常。确保网络正常连接互联网，正常访问华为云官网，成功获取Token等。如果使用代理，需要保证代理可用性。检查url

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成结束响应 - 语音交互服务 SIS

语音合成结束响应功能介绍当合成引擎处理完合成请求后，会发送合成结束响应。客户端收到该响应后关闭当前Websocket链接即可。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为END，表示语音合成结束。 trace_id String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果每个用户独立建立websocket连接，不可共用一个websocket连接。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
有哪些途径可以使用语音交互的API - 语音交互服务 SIS

有哪些途径可以使用语音交互的API 共有三种方式可以基于已构建好的请求消息发起请求。 cURL cURL是一个命令行工具，用来执行各种URL操作和信息传输。cURL充当的是HTTP客户端，可以发送HTTP请求给服务端，并接收响应消息。cURL适用于接口调试。关于cURL详细信息请参见

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成错误响应 - 语音交互服务 SIS

语音合成错误响应功能介绍合成引擎处理合成请求时如果发生错误则返回该响应。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为ERROR，表示错误响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' 充值后需要等待1min后才能进行调用。如果使用token进行调用api（非ak/sk），需要在充值后重新获取token，再进行调用。父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应

总条数： 216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

识别结果响应 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

语音合成结束响应 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

有哪些途径可以使用语音交互的API - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

语音合成错误响应 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线