搜索_华为云

实时语音识别连续模式 - 语音交互服务 SIS

返回识别结果。如果送入的一段语音较长，甚至有可能在一次返回中包括了多段的识别结果。由于引入了静音检测，连续识别模式通常会比流式识别能具有更高的效率，因为对于静音段将不会进行特征提取和解码操作，因而能更有效地利用CPU。而流式识别通常和客户端的端点检测功能相结合，只将检测到的有效语音段上传到服务器进行识别。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
流式一句话 - 语音交互服务 SIS

用户Token。用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。 Enterprise-Project-Id 否 String 企业项目ID。SIS支持通过企业项目管理（EPS）对不同用户组和用户的资源使用，进行分账。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音合成结束响应 - 语音交互服务 SIS

语音合成结束响应功能介绍当合成引擎处理完合成请求后，会发送合成结束响应。客户端收到该响应后关闭当前Websocket链接即可。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为END，表示语音合成结束。 trace_id String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音合成错误响应 - 语音交互服务 SIS

语音合成错误响应功能介绍合成引擎处理合成请求时如果发生错误则返回该响应。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为ERROR，表示错误响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
如何调整并发 - 语音交互服务 SIS

如何调整并发 API接口支持并发调用。具体可咨询商务合作。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
获取账号ID - 语音交互服务 SIS
获取账号ID - 语音交互服务 SIS

获取账号ID 在调用接口的时候，部分URL中需要填入账号ID（domain-id），所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下：注册并登录管理控制台。在控制台中，鼠标移动至右上角的用户名处，在下拉列表中选择“我的凭证”。图1 我的凭证入口在“我的凭证”页面的项目列表中查看账号ID。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

成）服务所提供的API为自研API。表1 实时语音识别接口说明接口类型说明实时语音识别接口华为云提供的Websocket接口，主要用于实时语音识别。音频分片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明一句话识别

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 user name指用户名称，domain name指用户所属的账号名称。如果是账号获取token，账号的user name和domain name相同。如果是IAM用户获取toke

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

输入的音频/视频/试题文本大小超过限制。请参考错误信息和API资料，减少音频/视频/试题文本大小。 SIS.0702 输入参数不合法。例如，评测语言/评测模式不支持；音频/视频格式不支持；试题文本无效等情况。请参考错误信息和API资料，更换正确的输入参数。 SIS.30003 下载OBS上的音频失败。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
一句话识别Http接口 - 语音交互服务 SIS

audio_format 是 String 音频格式，具体信息请参见《API参考》中一句话识别章节。 model_property 是 String 属性字符串，语言_采样率_模型，如chinese_16k_general。具体信息请参见《API参考》中一句话识别章节。 add_punc 否 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS

使用HTML5 Websocket API发送websocket请求如何携带token 浏览器 WebSocket API 是 HTML5 提供的一种在 TCP 连接上进行全双工通讯协议的 API, 但 WebSocket API 不支持设置 Headers，如需设置 Headers

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
获取项目ID - 语音交互服务 SIS
获取项目ID - 语音交互服务 SIS

多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。调用API获取项目ID 获取项目ID的接口为“GET https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点。接口的认证鉴权请参见认证鉴权。响应示例如下，例如，语音交互服务

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
附录 - 语音交互服务 SIS
附录 - 语音交互服务 SIS

附录示例音频获取项目ID 获取账号ID 获取AK/SK 公共请求参数公共响应参数状态码错误码配置OBS访问权限

 帮助中心 > 语音交互服务 SIS > API参考
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

ServerException import json # 鉴权参数 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK

总条数： 189

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时语音识别连续模式 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

语音合成结束响应 - 语音交互服务 SIS

语音合成错误响应 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

如何调整并发 - 语音交互服务 SIS

获取账号ID - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS

获取项目ID - 语音交互服务 SIS

附录 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线