搜索_华为云

如何使用Websocket调用实时语音识别 - 语音交互服务 SIS

如何使用Websocket调用实时语音识别解决方案 1. 下载Java SDK 或 Python SDK，参考《SDK参考》中获取SDK章节。 2. 配置SDK环境，参考《SDK参考》中配置Java环境。 3. 使用SDK里的demo进行调用。参考Java SDK和Python

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

dk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audio_format参数设置的语音格式为准。若audio_format的值设置为wav，则解码后输出为wav格

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
Token与Project ID不匹配报错 - 语音交互服务 SIS

Token与Project ID不匹配报错获取Token时，出现the parameters of requesting token are wrong or project_id doesn't match the token报错。检查获取Token过程中，请求url中的区

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

开始识别功能介绍当wss握手请求收到成功响应后，客户端到服务端的通信协议会升级为Websocket协议。通过Websocket协议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
识别结果响应 - 语音交互服务 SIS

识别结果响应服务端在收到客户端发送的连续音频数据后，当服务端识别出结果后会实时向客户端按句推送识别结果响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为RESULT，表示识别结果响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
一句话识别Http接口 - 语音交互服务 SIS

请参见错误码。表4 AsrCustomShortResponse 参数名是否必选参数类型说明 trace_id 是 String 服务内部的令牌，可用于在日志中追溯具体流程，调用失败无此字段。在某些错误情况下可能没有此令牌字符串。 result 是 Object 调用成

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音合成的base64编码如何使用 - 语音交互服务 SIS

语音合成的base64编码如何使用问题现象用户在使用语音合成获取响应体的base64编码，不了解应该如何进一步使用。解决方案 1. 建议用户使用Java或Python SDK，可参考SDK简介。 2. 使用html网页播放，新建一个html文件，如下填写内容，即可在浏览器播放。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
Java SDK是否支持使用Maven导入 - 语音交互服务 SIS

Java SDK是否支持使用Maven导入支持Maven引入，引入方式详见《SDK参考》中获取SDK章节。父主题： SDK使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > SDK使用类
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。请求消息表1 参数说明参数名是否必选参数类型说明 command

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
开始合成响应 - 语音交互服务 SIS

名称参数类型说明 resp_type String 响应类型。参数值为START，表示开始语音合成。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。示例 { "resp_type": "START", "trace_id":

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
一句话识别Websocket接口 - 语音交互服务 SIS

RasrResponse 参数名参数类型说明 resp_type String 参数值为RESULT，表示识别结果响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。 segments Array of objects 多句结果。请参考表6。表6 Segment

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音合成结束响应 - 语音交互服务 SIS

响应参数名称参数类型说明 resp_type String 响应类型。参数值为END，表示语音合成结束。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。 reason String 结束原因。表2 结束原因表名称说明 NORMAL 正常结束。 ERROR

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音合成错误响应 - 语音交互服务 SIS

响应参数名称参数类型说明 resp_type String 响应类型。参数值为ERROR，表示错误响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。 error_code String 参见错误码列表。 error_msg String 返回错误信息。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
为什么WebSocket一直连接不成功 - 语音交互服务 SIS

为什么WebSocket一直连接不成功问题现象由于在没连接成功前无法返回服务端任何信息，因此连接不成功需要多方面定位原因。解决方案 1. 检查网络是否可用，能否连接互联网，检查url输入是否正确。 2. 检查Token是否可用，检查Token的方法参考调用语音交互的API显示auth

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错问题描述识别文件错误，提示“The silence time is too long, and the audio will not

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类

总条数： 216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何使用Websocket调用实时语音识别 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

Token与Project ID不匹配报错 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

语音合成的base64编码如何使用 - 语音交互服务 SIS

Java SDK是否支持使用Maven导入 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

开始合成响应 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

语音合成结束响应 - 语音交互服务 SIS

语音合成错误响应 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

为什么WebSocket一直连接不成功 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线