搜索_华为云

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
一句话识别(websocket版) - 语音交互服务 SIS

一句话识别(websocket版) 前提条件确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SasrWsClient，其中参数包含AuthInfo，SisHttpConfig，SasrWsResponseListener

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

确保网络正常连接互联网，正常访问华为云官网，成功获取Token等。如果使用代理，需要保证代理可用性。检查url是否存在错误。如书写出错，http方法出错（get和post混淆）等。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
一句话识别Websocket接口 - 语音交互服务 SIS

一句话识别Websocket接口前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。该功能为1.70及以上版本SDK新增功能，使用前请检查并更新SDK版本。请参考

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
调用语音交互的API显示auth failed - 语音交互服务 SIS

调用语音交互的API显示auth failed 问题现象校验失败服务端通常是使用不正确的Token进行访问，可能产生的原因有多种。解决方案检查用户账号是否正常。当用户账号存在未实名认证、未充值或者属于冻结状态。您可登录账号，在用户检查是否实名认证，是否有余额（以上信息在用户

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
有哪些途径可以使用语音交互的API - 语音交互服务 SIS

有哪些途径可以使用语音交互的API 共有三种方式可以基于已构建好的请求消息发起请求。 cURL cURL是一个命令行工具，用来执行各种URL操作和信息传输。cURL充当的是HTTP客户端，可以发送HTTP请求给服务端，并接收响应消息。cURL适用于接口调试。关于cURL详细信息请参见

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果每个用户独立建立websocket连接，不可共用一个websocket连接。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' 充值后需要等待1min后才能进行调用。如果使用token进行调用api（非ak/sk），需要在充值后重新获取token，再进行调用。父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 user name指用户名称，domain name指用户所属的账号名称。如果是账号获取token，账号的user name和domain name相同。如果是IAM用户获取token

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类

总条数： 216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

一句话识别(websocket版) - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

调用语音交互的API显示auth failed - 语音交互服务 SIS

有哪些途径可以使用语音交互的API - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线