搜索_华为云

流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
什么是语音交互服务 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API（Application Programming Interface，应用程序编程接口）获取语音交互结果。例如用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

于实时语音识别。音频分片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明一句话识别一句话识别接口，用于短语音的同步识别。一次性上传整个音频，响应中即返回识别结果。表3 录音文件识别接口说明接口类型说明录音文件识别

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
语音交互服务使用简介 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时

 帮助中心 > 语音交互服务 SIS > 快速入门
一句话识别Websocket接口 - 语音交互服务 SIS

多句结果。详见表5。表5 Segment 参数名称是否必选参数类型描述 start_time 是 Integer 一句的起始时间戳，单位为ms。 end_time 是 Integer 一句的结束时间戳，单位为ms。 is_final 是 Boolen true表示是最终结果， false表示为中间临时结果。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > SDK参考
发送音频数据 - 语音交互服务 SIS

在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，建议在需要实时反馈的情况下100ms，不需要实时反

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别(websocket版) - 语音交互服务 SIS

代理地址（例：“proxy.huaweicloud.com”）。 port 否 int 代理端口号（例：8080）。表5 SasrWsResponseListener 函数描述 void onExceededAudio(); 识别时长超过一分钟时，响应，后续录入音频不在识别。 void on

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
实时语音识别连续模式 - 语音交互服务 SIS

代理密码（例：test）。 hostName 否 String 代理地址（例：“proxy.huaweicloud.com”）。 port 否 int 代理端口号（例：8080）。表5 RasrResponseListener 函数描述 void onResponseBegin(AsrResponse

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
语音合成(webSocket版) - 语音交互服务 SIS

代理密码（例：test）。 hostName 否 String 代理地址（例：“proxy.huaweicloud.com”）。 port 否 int 代理端口号（例：8080）。其中RttsResponseListener使用户自定义的，建立webSocket之后，接受服务端返回消息的Listener。

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
实时语音识别 - 语音交互服务 SIS

实时语音识别支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音合成 - 语音交互服务 SIS

common，通用领域默认：chinese_xiaoyan_common 实时语音合成和语音合成属于同一种资源，按次计费。实时语音合成普通发音人，每100字计一次。精品发音人每50字计一次。响应参数 Python SDK响应结果为byte数组，保存合成音频数据。详见代码示例。调用失败处理方法请参见错误码。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
配置热词表（可选） - 语音交互服务 SIS

支持的region：北京四、上海一支持的API：实时语音识别chinese_16k_general/chinese_8k_general、一句话识别chinese_16k_general和录音文件识别chinese_16k_media。热词3.0能创建成功并不意味着一定生效，仅对以上四个API生效。其余API请按照热词1

帮助中心 > 语音交互服务 SIS > 用户指南
实时语音识别单句模式 - 语音交互服务 SIS

将当前这一段的识别结果返回。和连续识别不同的是，在单句模式下，返回第一段的识别结果后，将不再继续识别后续的音频。这主要是用于和用户进行语音交互的场景下，当用户说完一句话后，往往会等待后续的交互操作，例如聆听根据识别结果播报的相关内容，因而没有必要继续识别后续的音频。 wss-URI

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别连续模式 - 语音交互服务 SIS

进行实际的解码工作，如果检测到静音，将直接丢弃。如果检测到一段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次返回识别结果。如果送入的一段语音较长，甚至有可能在一次返回中包括了多段的识别结果。由于引入了静音检测，连续识

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求

总条数： 35

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

流式一句话 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

一句话识别(websocket版) - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

语音合成(webSocket版) - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线