搜索_华为云

开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
录音文件识别 - 语音交互服务 SIS

确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

录音文件识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。初始化Client

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
配置Java环境 - 语音交互服务 SIS

配置Java环境配置环境在使用语音交互SDK时，需要准备的环境请参见表开发环境。目前Java SDK不支持在android中使用。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。 JDK Java开发环境的基本配置。版本要求：强烈推荐使用1

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
严重错误响应 - 语音交互服务 SIS

严重错误，通常指流程无法继续的情况。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示此次合成发生不可恢复的错误。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
配置热词表（可选） - 语音交互服务 SIS

用于提升热词召回率，主要应用于以下场景。所配置的关键词与常见词发音一样，导致热词不能百分百生效。如雇工 vs 故宫。由于故宫更加常见，所以可能存在即使配置了雇工这个热词，也无法召回的情况。所配置的关键词含有生僻字，如葳蕤，霜蟾。这些生僻字出现的概率较低，所以在热词搜索过程中，可能不生效。所配置的关键词较常见

 帮助中心 > 语音交互服务 SIS > 用户指南
提交录音文件识别任务 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。表4 请求Body参数

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
配置CPP环境（Linux） - 语音交互服务 SIS

cmake 三方库安装本SDK所依赖的三方库包含 - openssl - jsoncpp - websocketpp - glog - gflags - boost 依赖库均以源码形式存放在SDK根目录，SDK默认是开启所有依赖库安装，即运行cmake命令时，SDK会默认安装这些依赖库。

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
配置Android 环境 - 语音交互服务 SIS

配置Android 环境配置环境。在使用语音交互SDK时，需要提前配置好android系统的开发环境，如表1所示。表1 配置环境准备项准备项说明 JDK Java开发环境的基础配置。版本要求:推荐使用1.8版本。 Gradle 在Gradle官网上下载好之后，配置环境变量即可。推荐使用Gradle7

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
错误响应 - 语音交互服务 SIS
错误响应 - 语音交互服务 SIS

错误响应，通常是指不影响流程，但当前会话无法再进行下去的错误，包括如下情况：配置串错误，包括存在不识别的配置串，或者配置串值的范围不合法。时序不正确，比如连续发送两次“开始识别”指令。识别过程中发生错误，比如音频解码发生错误。出现错误响应时，如果已经在一个会话中了，会再发送一个“结束识别”的响应，表示识别会话

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

服务内部的令牌，可用于在日志中追溯具体流程。 event String 具体的事件，详细参数可参见event取值范围及其说明。 timestamp Integer 保留字段。将来会用于此事件发生的具体时间，以会话开始作为0点，单位为ms。 event取值范围及其说明表2 event取值范围

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
配置Python环境 - 语音交互服务 SIS

配置Python环境前提条件确保已安装Python3，目前Python SDK仅支持Python3。确保已安装setuptools、requests、websocket-client。操作步骤下载SDK，通过pip-list命令查看安装包。若未安装，则执行以下命令： pip

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如：cn-north-4。具体请参考终端节点。 project_id 是 String 项目ID，同region一一对应，参考获取项目ID。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
配置OBS访问权限 - 语音交互服务 SIS

务使用成本，降低服务的响应时长，提升服务使用的体验。语音交互服务优先推荐使用同一region下OBS的音频链接作为传入音频的URL。考虑到数据的安全，语音交互服务无法直接获取到用户OBS数据，需要用户开启公共读授权或者语音交互服务授权。开启公共读授权开启公共授权，则数据全网

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
websocket接口 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。开始识别

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
配置CPP环境（Windows） - 语音交互服务 SIS

配置CPP环境（Windows）当前Windows 版本 CPP SDK基于visual studio 运行，确保已安装visual studio 2017。依赖curl、openssl、boost、websocketpp软件，相关安装包已打包至SDK中，使用方法详见SDk的使用说明”。

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

GET：请求服务器返回指定资源。 PUT：请求服务器更新指定资源。 POST：请求服务器新增资源或执行特殊操作。 DELETE：请求服务器删除指定资源，如删除对象等。 HEAD：请求服务器资源头部。 PATCH：请求服务器更新资源的部分内容。当资源不存在的时候，PATCH可能会去创建一个新的资源。

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

一句话识别可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据，系统经过处理，生成语音对应的文字，支持的语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。产品优势高识别率基于深度学习技术，对特定领域场景的语音识别进行优化，识别率达到业界领先。

帮助中心 > 语音交互服务 SIS > 产品介绍

总条数： 102

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开始识别请求响应 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

配置Java环境 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

配置Android 环境 - 语音交互服务 SIS

错误响应 - 语音交互服务 SIS

事件响应 - 语音交互服务 SIS

配置Python环境 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

配置CPP环境（Windows） - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线