搜索_华为云

流式一句话 - 语音交互服务 SIS

该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后，仅延迟很短的时间（也即等待处理最后一段语音数据以及获取最终

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
提交录音文件识别任务 - 语音交互服务 SIS

16k16bit裸音频录音数据。 pcm8k16bit 8k16bit裸音频录音数据。 ulaw16k8bit 16k8bit ulaw 裸音频录音数据。 ulaw8k8bit 8k8bit ulaw 裸音频录音数据。 alaw16k8bit 16k8bit alaw 裸音频录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
责任共担 - 语音交互服务 SIS
责任共担 - 语音交互服务 SIS

aaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思路与

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
SIS.0304报错 - 语音交互服务 SIS
SIS.0304报错 - 语音交互服务 SIS

会报这个错误。解决方案 1. 检查代码是否存在发送音频后睡眠过多时间。 2. 检查是否发送end请求，是否关闭客户端。超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。父主题：错误码类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
配置OBS访问权限 - 语音交互服务 SIS

在OBS“桶列表”页，单击创建的OBS桶。图2 进入OBS桶进入“对象”页面，将音频数据上传至OBS桶中。图3 上传视频数据获取音频URL 单击已上传的数据名称，进入数据详情页。图4 进入数据详情页复制链接，获取数据URL。图5 获取数据URL 父主题：附录

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
热词管理 - 语音交互服务 SIS
热词管理 - 语音交互服务 SIS

HotWordRequest 参数名称是否必选参数类型描述 name 是 String 热词表名，创建时不可重复。内容限制为字母，数字，下中划线和井号，长度不超过32字节。 language 是 String 热词表语言类型，目前支持汉语普通话“chinese_mandarin”。 contents

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别 - 语音交互服务 SIS

确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
识别结果响应 - 语音交互服务 SIS

服务内部的令牌，可用于在日志中追溯具体流程。 segments Array of objects 多句结果。请参考表 segment 数据结构。表2 segment 数据结构参数名参数类型说明 start_time Integer 相对时间戳，表示一句的起始，单位为ms。 end_time

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

事件响应服务器端检测到某些事件时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为EVENT，表示开始识别响应。 trace_id String 服

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

nese_xiaoqi_common。具体信息请参见《API参考》中语音合成章节。 isSaved 否 Boolean 是否选择合成的音频数据保存到本地，默认不保存。 savePath 否 String 选择保存到本地的路径。路径需具体到文件，如D:/test.wav。响应参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

相同，所以简洁起见将这两部分省略。请求方法 HTTP请求方法（也称为操作或动词），它告诉服务你正在请求什么类型的操作。 GET：请求服务器返回指定资源。 PUT：请求服务器更新指定资源。 POST：请求服务器新增资源或执行特殊操作。 DELETE：请求服务器删除指定资源，如删除对象等。

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
Websocket握手请求 - 语音交互服务 SIS

Websocket握手请求功能介绍本接口提供实时流式语音合成。用户每次建立连接，发送待合成文本，服务端将合成结果响应给用户。一次连接只能发送一次文本，如果有多段文本需要合成，需要多次建立连接。实时语音合成和语音合成均属于语音合成接口，采用完全相同的计费规则，两者价格梯度可互相叠加，可参考价格计算器。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
一句话识别Http接口 - 语音交互服务 SIS

AsrCustomShortRequest 参数名称是否必选参数类型描述 data 是 String 本地音频文件经过Base64编码后的字符串，音频文件时长不超过1min。 audioFormat 是 String 音频格式，具体信息请参见《API参考》中一句话识别章节。 property 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

说明录音文件识别录音文件识别接口，用于转写不超过5小时的音频。由于录音文件转写需要较长的时间，因此转写是异步的。表4 语音合成接口说明接口类型说明语音合成/实时语音合成语音合成，依托先进的语音技术，使用深度学习算法，将文本转换为自然流畅的语音。用户通过实时访问和调用

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
实时语音识别 - 语音交互服务 SIS

punc 否 String 表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 digitNorm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 vadHead 否 Integer 头部最大静音时间，[0, 60000]，默认10000ms。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
一句话识别Websocket接口 - 语音交互服务 SIS

punc 否 String 表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 digitNorm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 intermediateResult 否 String 是否显示中间结果，yes

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

inese_xiaoyan_common。具体信息请参见《API参考》中语音合成章节。 saved 否 Boolean 是否选择合成的音频数据保存到本地，默认不保存。 saved_path 否 String 选择保存到本地的路径，需要具体到音频文件，如D:/test.wav。响应参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
公共请求参数 - 语音交互服务 SIS

Sec-WebSocket-Key 发送WebSocket握手请求时，包含该头域。采用Base64编码的随机16字节长的字符序列。用来发送给服务器使用，服务器会使用此字段组装成另一个key值放在握手返回信息里发送客户端。 x3JJHMbDL1EzLkh9GBhXDw== Sec-WebSocket-Version

帮助中心 > 语音交互服务 SIS > API参考 > 附录

总条数： 83

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

流式一句话 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

责任共担 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

SIS.0304报错 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

热词管理 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

事件响应 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

Websocket握手请求 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

公共请求参数 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线