搜索_华为云

准备数据 - 语音交互服务 SIS
准备数据 - 语音交互服务 SIS

准备数据数据要求受技术与成本多种因素制约，SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。

帮助中心 > 语音交互服务 SIS > 用户指南
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
为什么WebSocket一直连接不成功 - 语音交互服务 SIS

为什么WebSocket一直连接不成功问题现象由于在没连接成功前无法返回服务端任何信息，因此连接不成功需要多方面定位原因。解决方案 1. 检查网络是否可用，能否连接互联网，检查url输入是否正确。 2. 检查Token是否可用，检查Token的方法参考调用语音交互的API显示

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音合成 - 语音交互服务 SIS

实时语音合成前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RttsClient详见表 RttsClient初始化参数。表1 RttsClient初始化参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
什么是区域与可用区 - 语音交互服务 SIS

云服务之间的关系如果多个云服务一起搭配使用，需要注意：不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。资源的价格不同区域的资源价格可能有差异，请参见华为云服务价格详情。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
数据保护技术 - 语音交互服务 SIS

数据保护技术在使用语音交互服务过程中委托我们处理的语音音频和文本等数据，您完全拥有上述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将在中华人民共和国境内处理

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。请求消息表1 参数说明参数名是否必选参数类型说明 command

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
配置OBS访问权限 - 语音交互服务 SIS

配置OBS访问权限 OBS服务 OBS全称Object Storage Service（对象存储服务），提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用成本

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
识别结果响应 - 语音交互服务 SIS

识别结果响应服务端在收到客户端发送的连续音频数据后，当服务端识别出结果后会实时向客户端按句推送识别结果响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为RESULT

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audio_format

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

接口说明实时语音识别接口基于Websocket协议实现。分别提供了“流式一句话”、“实时语音识别连续模式”、“实时语音识别单句模式”三种模式。三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
配置CPP环境（Linux） - 语音交互服务 SIS

配置CPP环境（Linux） c++版本需要在11及以上 cmake版本需要在3.14及以上 gcc-c++ 版本需要在5.4.0及以上 Linux版本CPP SDK依赖g++,cmake，此三项需要提前在机器安装，才能完成sdk编译和运行. CentOS yum install

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境

总条数： 65

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

为什么WebSocket一直连接不成功 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线