搜索_华为云

音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
创建热词表 - 语音交互服务 SIS

（通常会识别为"王小明”）、运输域的“高栏”等。热词不建议太长，也不要有标点符号或者特殊符号。具体限制参见创建热词表更新热词表章节。功能介绍新建一个热词表，创建成功返回id。每个用户限制创建100个热词表。调用热词时，需确保调用热词的区域与创建热词的区域一致。如下图位置可查询创建热词所在区域：

帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
录音文件识别 - 语音交互服务 SIS

AsrCustomLongRequest 参数名称是否必选参数类型描述 dataUrl 是 String 存放录音文件地址：推荐使用华为云OBS：授权配置请参见OBS配置。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
开始合成响应 - 语音交互服务 SIS

开始合成响应功能介绍语音合成引擎收到实时语音合成请求时，首先向客户端发送合成开始响应，表示开始处理语音合成请求。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为START，表示开始语音合成。 trace_id String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成功能介绍语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 S

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
语音合成结束响应 - 语音交互服务 SIS

语音合成结束响应功能介绍当合成引擎处理完合成请求后，会发送合成结束响应。客户端收到该响应后关闭当前Websocket链接即可。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为END，表示语音合成结束。 trace_id String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音合成错误响应 - 语音交互服务 SIS

语音合成错误响应功能介绍合成引擎处理合成请求时如果发生错误则返回该响应。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为ERROR，表示错误响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。请求消息表1 参数说明参数名是否必选参数类型说明 command

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
如何调用WebSocket API - 语音交互服务 SIS

如何调用WebSocket API 前提条件在调用实时语音识别的Websocket接口之前，您需要完成Token认证，详细操作指导请参见认证鉴权。接口使用介绍实时语音识别接口使用Websocket协议承载，客户端与服务端交流流程如图1所示。分为三个主要步骤： WebSocket握手。基于WebSocket协议进行实时语音识别。

帮助中心 > 语音交互服务 SIS > API参考
严重错误响应 - 语音交互服务 SIS

严重错误响应功能介绍严重错误，通常指流程无法继续的情况。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示此次合成发生不可恢复的错误。 trace_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
开始语音合成请求 - 语音交互服务 SIS

开始语音合成请求功能介绍客户端与语音合成引擎建立Websocket连接后，可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求，需在每次请求重新建立websocket连接，一次连接只能处理一次合成请求。请求消息表1 参数说明名称参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
语音合成的base64编码如何使用 - 语音交互服务 SIS

用户在使用语音合成获取响应体的base64编码，不了解应该如何进一步使用。解决方案 1. 建议用户使用Java或Python SDK，可参考SDK简介。 2. 使用html网页播放，新建一个html文件，如下填写内容，即可在浏览器播放。 <audio controls="controls"

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
websocket接口 - 语音交互服务 SIS

websocket接口功能介绍一句话识别websocket接口支持识别1min以内的音频，交互过程如图客户端和服务端交互流程所示，主要分为开始识别、发送音频数据，结束识别、断开连接四个步骤。 websocket接口同http接口一致按次计费，只要建立连接成功，发送音频，服务

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
Websocket握手请求 - 语音交互服务 SIS

Websocket握手请求功能介绍本接口提供实时流式语音合成。用户每次建立连接，发送待合成文本，服务端将合成结果响应给用户。一次连接只能发送一次文本，如果有多段文本需要合成，需要多次建立连接。实时语音合成和语音合成均属于语音合成接口，采用完全相同的计费规则，两者价格梯度可互相叠加，可参考价格计算器。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

开始识别功能介绍当wss握手请求收到成功响应后，客户端到服务端的通信协议会升级为Websocket协议。通过Websocket协议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求

总条数： 120

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

音频流数据 - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

开始合成响应 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

语音合成结束响应 - 语音交互服务 SIS

语音合成错误响应 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

如何调用WebSocket API - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

语音合成的base64编码如何使用 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

Websocket握手请求 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线