搜索_华为云

配置Java环境 - 语音交互服务 SIS

配置Java环境配置环境在使用语音交互SDK时，需要准备的环境请参见表开发环境。目前Java SDK不支持在android中使用。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。 JDK Java开发环境的基本配置。版本要求：强烈推荐使用1

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
为什么WebSocket一直连接不成功 - 语音交互服务 SIS

为什么WebSocket一直连接不成功问题现象由于在没连接成功前无法返回服务端任何信息，因此连接不成功需要多方面定位原因。解决方案 1. 检查网络是否可用，能否连接互联网，检查url输入是否正确。 2. 检查Token是否可用，检查Token的方法参考调用语音交互的API显示auth

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
一句话识别(http版) - 语音交互服务 SIS

一句话识别(http版) 前提条件确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SisClient,详细信息如下。配置客户端连接参数。默认配置 // 使用默认配置 HttpConfig config =

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
录音文件识别 - 语音交互服务 SIS

region，如cn-north-4 """ todo 请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配. 例如wav音频，格式是auto。具体参考api文档。例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

todo 请正确填写音频格式和模型属性字符串 * 1. 音频格式一定要相匹配。 * 例如obs url是xx.wav, 则在录音文件识别格式是auto。 * 例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
配置Python环境 - 语音交互服务 SIS

配置Python环境前提条件确保已安装Python3，目前Python SDK仅支持Python3。确保已安装setuptools、requests、websocket-client。操作步骤下载SDK，通过pip-list命令查看安装包。若未安装，则执行以下命令： pip

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
配置OBS访问权限 - 语音交互服务 SIS

授权。开启公共读授权开启公共授权，则数据全网可见，所有用户均可访问，不推荐使用此方法，该方法仅针对同一region服务有效。配置公共读可参考配置标准桶策略，创建桶策略为“公共读”。一般私密数据不建议用此方法。目前仅支持访问用户个人OBS下的音频的链接，不支持读取其他用户公共读的链接。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音合成(http版) - 语音交互服务 SIS

语音合成(http版) 前提条件确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SisClient,详细信息如下。配置客户端连接参数。默认配置 // 使用默认配置 HttpConfig config =

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
配置热词表（可选） - 语音交互服务 SIS

况。所配置的关键词含有生僻字，如葳蕤，霜蟾。这些生僻字出现的概率较低，所以在热词搜索过程中，可能不生效。所配置的关键词较常见，与其他高频词容易混淆（误召回），如述职 vs 数值。配置规则：自定义权重热词用/将热词分为两个部分，左边即为普通热词，遵循普通热词的配置规则。右

 帮助中心 > 语音交互服务 SIS > 用户指南
配置Android 环境 - 语音交互服务 SIS

配置Android 环境配置环境。在使用语音交互SDK时，需要提前配置好android系统的开发环境，如表1所示。表1 配置环境准备项准备项说明 JDK Java开发环境的基础配置。版本要求:推荐使用1.8版本。 Gradle 在Gradle官网上下载好之后，配置环境变量即可。推荐使用Gradle7

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String 表示客户端发送开始识别请求，参数值需设置为START。 config 是 Object 配置信息。结构信息请参见表 config数据结构。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
开始语音合成请求 - 语音交互服务 SIS

开始语音合成请求功能介绍客户端与语音合成引擎建立Websocket连接后，可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求，需在每次请求重新建立websocket连接，一次连接只能处理一次合成请求。请求消息表1 参数说明名称参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto 自动判断，系统会

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
配置CPP环境（Linux） - 语音交互服务 SIS

cmake 三方库安装本SDK所依赖的三方库包含 - openssl - jsoncpp - websocketpp - glog - gflags - boost 依赖库均以源码形式存放在SDK根目录，SDK默认是开启所有依赖库安装，即运行cmake命令时，SDK会默认安装这些依赖库。

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
热词管理 - 语音交互服务 SIS
热词管理 - 语音交互服务 SIS

热词管理前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化HotWordClient，详见表 HotWordClient初始化参数。表1 HotWordClient初始化参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应

总条数： 102

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Java环境 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

为什么WebSocket一直连接不成功 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

一句话识别(http版) - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

配置Python环境 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

语音合成(http版) - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

配置Android 环境 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

热词管理 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线