搜索_华为云

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
一句话识别(websocket版) - 语音交互服务 SIS

一句话识别(websocket版) 前提条件确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SasrWsClient，其中参数包含AuthInfo，SisHttpConfig，SasrWsResponseListener

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
发送音频数据 - 语音交互服务 SIS

当前SIS服务对于8k音频的分片大小限制为[160, 32768]字节, 16k音频的分片大小限制为[320, 65536]字节, 分片大小超出上限或低于下限会报错。父主题：实时语音识别请求

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果每个用户独立建立websocket连接，不可共用一个websocket连接。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
调用语音交互的API显示auth failed - 语音交互服务 SIS

正确的嵌套应该如下列代码示例所示，错误的嵌套也能获取Token，但无法访问服务。使用AK/SK方式访问，检查AK和SK是否填写正确。检查“project_id”是否填写正确。“project_id”可参考获取项目ID。如果无法确定原因和解决问题，请联系技术服务人员。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。父主题：权限类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
语音合成结果响应 - 语音交互服务 SIS

语音合成结果响应音频流数据时间戳数据父主题：实时语音合成响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout）问题现象超时通常是由于网络不通造成的，需要对网络环境和代码进行具体分析。解决方案检查网络是否正常。确保网络正常连接互联网，正常访问华为云官网，成功获取Token等。如果使用代理，需要保证代理可用性。检查url

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别工作流程 - 语音交互服务 SIS

服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。音频发送结束后，客户端会发送结束请求，服务端会返回end响应。实时语音识别必须客户端要主动断开连接。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS

使用HTML5 Websocket API发送websocket请求如何携带token 浏览器 WebSocket API 是 HTML5 提供的一种在 TCP 连接上进行全双工通讯协议的 API, 但 WebSocket API 不支持设置 Headers，如需设置 Headers

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

请检查您的服务器时间和网络时间是否一致，时间同步后，可解决该报错。父主题：错误码类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' 充值后需要等待1min后才能进行调用。如果使用token进行调用api（非ak/sk），需要在充值后重新获取token，再进行调用。父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类

总条数： 216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

一句话识别(websocket版) - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

调用语音交互的API显示auth failed - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音合成结果响应 - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线