搜索_华为云

使用流程简介 - 语音交互服务 SIS

使用流程简介用户通过调用SIS服务提供的API或SDK，进行语音转文本或语音合成任务，返回的结果需要您通过编码对接到业务系统中。图1 使用流程

 帮助中心 > 语音交互服务 SIS > 用户指南
什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API（Application Programming Interface，应用程序编程接口）获取语音交互结果。例如用户通过语音识别功能，将口述音频

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
认证鉴权 - 语音交互服务 SIS
认证鉴权 - 语音交互服务 SIS

认证鉴权调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证通用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key)加密调用请求。 Token认证 Token的有效期为24小时，需要使用同一个

 帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
配置Android 环境 - 语音交互服务 SIS

配置Android 环境配置环境。在使用语音交互SDK时，需要提前配置好android系统的开发环境，如表1所示。表1 配置环境准备项准备项说明 JDK Java开发环境的基础配置。版本要求:推荐使用1.8版本。 Gradle 在Gradle官网上下载好之后，配置环境变量即可

 帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

开始识别功能介绍当wss握手请求收到成功响应后，客户端到服务端的通信协议会升级为Websocket协议。通过Websocket协议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
录音文件识别 - 语音交互服务 SIS

表3 AsrCustomLongRequest 参数名称是否必选参数类型描述 dataUrl 是 String 存放录音文件地址：推荐使用华为云OBS：授权配置请参见OBS配置。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
获取录音文件识别结果 - 语音交互服务 SIS

获取录音文件识别结果功能介绍该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
录音文件极速版 - 语音交互服务 SIS

录音文件极速版前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS，示例音频可参考下载SDK压缩包文件，同时确保服务已授权访问OBS，可参考配置OBS服务。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化FlashLasrClient

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件极速版 - 语音交互服务 SIS

录音文件极速版前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化FlashLasrClient

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
配置CPP环境（Linux） - 语音交互服务 SIS

配置CPP环境（Linux） c++版本需要在11及以上 cmake版本需要在3.14及以上 gcc-c++ 版本需要在5.4.0及以上 Linux版本CPP SDK依赖g++,cmake，此三项需要提前在机器安装，才能完成sdk编译和运行. CentOS yum install

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
公共响应参数 - 语音交互服务 SIS

公共响应参数公共响应参数如表公共响应参数所示。表1 公共响应参数参数名说明 Content-Length 响应消息体的字节长度，单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 Upgrade 发送WebSocket握手请求时

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
如何查看当前接口是否免费调用 - 语音交互服务 SIS

如何查看当前接口是否免费调用计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

SIS.0535报错问题描述使用SDK调用录音文件识别时一直返回"SIS.0535"，错误信息显示为："Audio format is invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文相关语义特征

 帮助中心 > 语音交互服务 SIS > 产品介绍

总条数： 95

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用流程简介 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

认证鉴权 - 语音交互服务 SIS

配置Android 环境 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

公共响应参数 - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线