搜索_华为云

什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > 产品介绍
如何查看当前接口是否免费调用 - 语音交互服务 SIS

如何查看当前接口是否免费调用计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数。

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音交互服务的区域如何选择 - 语音交互服务 SIS

持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。父主题：区域与可用区

 帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
修订记录 - 语音交互服务 SIS
修订记录 - 语音交互服务 SIS

新增： iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增： CPP SDK支持Linux版本 2022-08-02 新增： Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP SDK新增实时语音合成 2022-07-07 新增：

帮助中心 > 语音交互服务 SIS > SDK参考
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

提升教学效率。直播实时字幕将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。即时文本录入手机App上实时录音并即时提供转写的文本，例如语音输入法等。

帮助中心 > 语音交互服务 SIS > 产品介绍
配置热词表（可选） - 语音交互服务 SIS

配置热词表（可选）调用一句话识别、录音文件识别、实时语音识别API时，如果在您的业务领域有一些特有的词，默认识别效果差的时候可以考虑使用热词管理功能，将这些词添加到词表，改善识别效果。创建热词表（1.0版本）创建热词表有两种方式：控制台创建、调用API创建。本章节主要介绍通过控制台创建的方法。

帮助中心 > 语音交互服务 SIS > 用户指南
创建热词表 - 语音交互服务 SIS

创建热词表在一句话识别、录音文件识别、实时语音识别服务中，如果在您的业务领域有一些特有的词，默认识别效果差的时候可以考虑使用热词管理功能，将这些词添加到词表，改善识别效果。热词可以是姓名、公司名、某个领域的专有名词，如人名"王晓茗”（通常会识别为"王小明”）、运输域的“高栏”

帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
CPP SDK（Windows） - 语音交互服务 SIS

CPP SDK（Windows）使用实时语音识别使用实时语音合成

 帮助中心 > 语音交互服务 SIS > SDK参考
CPP SDK（Linux） - 语音交互服务 SIS

CPP SDK（Linux）使用实时语音识别使用实时语音合成

 帮助中心 > 语音交互服务 SIS > SDK参考
如何申请公测 - 语音交互服务 SIS

如何申请公测当前语音交互服务在中国区已全部商用，不需要申请，直接可以调用，调用会收费，计费方式详细请参考语音交互价格计算器。调用的详细操作请参考使用实时语音识别。登录华为云，单击右上角的“控制台”，进入“管理控制台”界面。在左侧服务列表中选择“EI企业智能 > 语音交互服务”。在语

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
Java SDK - 语音交互服务 SIS
Java SDK - 语音交互服务 SIS

Java SDK 一句话识别Http接口一句话识别Websocket接口录音文件识别实时语音识别语音合成热词管理实时语音合成录音文件极速版

 帮助中心 > 语音交互服务 SIS > SDK参考
Python SDK - 语音交互服务 SIS
Python SDK - 语音交互服务 SIS

Python SDK 一句话识别Http接口一句话识别Websocket接口录音文件识别实时语音识别语音合成热词管理实时语音合成录音文件极速版

 帮助中心 > 语音交互服务 SIS > SDK参考
API使用类 - 语音交互服务 SIS
API使用类 - 语音交互服务 SIS

recognized”报错 Token怎么获取如何申请公测如何修改发音人实时语音识别多人同时使用，如何区分各自识别结果使用HTML5 Websocket API发送websocket请求如何携带token 如何查看实时语音识别的中间结果

 帮助中心 > 语音交互服务 SIS > 常见问题
iOS SDK - 语音交互服务 SIS
iOS SDK - 语音交互服务 SIS

iOS SDK 一句话识别实时语音识别连续模式

 帮助中心 > 语音交互服务 SIS > SDK参考
约束与限制 - 语音交互服务 SIS

约束与限制实时语音识别一句话识别录音文件识别语音合成录音文件识别极速版

 帮助中心 > 语音交互服务 SIS > 产品介绍
Android SDK - 语音交互服务 SIS
Android SDK - 语音交互服务 SIS

Android SDK 一句话识别(http版) 一句话识别(websocket版) 实时语音识别连续模式语音合成(http版) 语音合成(webSocket版)

帮助中心 > 语音交互服务 SIS > SDK参考
配置Python环境 - 语音交互服务 SIS

websocket-client 在1.x版本以后，新增了onclose接口的入参，导致和之前旧版本不兼容。sdk1.7.1版本已解决该兼容性问题，旧版本sdk如果在使用实时流遇到onclose参数报错，可考虑更新sdk解决问题。父主题：准备环境

 帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
提交录音文件识别任务 - 语音交互服务 SIS

OBS服务，优先推荐使用与请求服务同一region的私有桶文件，如果region不一致，可考虑使用obs签名。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文。音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
websocket接口 - 语音交互服务 SIS

音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，建议在需要实时反馈的情况下100ms，不需要实时反馈的情况下500ms。结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

待识别的音频格式和audio_format参数格式要保证一致。对于录音文件识别接口，如果不确定该参数取值，可改为auto进行调试。使用实时语音识别时请确认是否分片发送音频，并在wss握手后发送start命令。报错data url is empty，时请参考配置OBS访问权限

 帮助中心 > 语音交互服务 SIS > API参考 > 附录

总条数： 94

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是语音交互服务 - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

修订记录 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

CPP SDK（Windows） - 语音交互服务 SIS

CPP SDK（Linux） - 语音交互服务 SIS

如何申请公测 - 语音交互服务 SIS

Java SDK - 语音交互服务 SIS

Python SDK - 语音交互服务 SIS

API使用类 - 语音交互服务 SIS

iOS SDK - 语音交互服务 SIS

约束与限制 - 语音交互服务 SIS

Android SDK - 语音交互服务 SIS

配置Python环境 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线