搜索_华为云

语音交互服务使用简介 - 语音交互服务 SIS

语音交互服务使用简介语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频

 帮助中心 > 语音交互服务 SIS > 快速入门
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
公共请求参数 - 语音交互服务 SIS

公共请求参数公共请求参数如表公共请求参数所示。表1 公共请求参数参数是否必选说明示例 Content-type 是发送的实体的MIME类型。 application/json Content-Length POST/PUT请求必填。 GET不能包含。请求body长度

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
API概览 - 语音交互服务 SIS
API概览 - 语音交互服务 SIS

API概览 SIS服务提供了两种接口，包含REST（Representational State Transfer）API，支持您通过HTTPS请求调用，请参见表1。也包含WebSocket接口，支持Websocket协议，请参见表2。表1 REST API功能接口功能 API

帮助中心 > 语音交互服务 SIS > API参考
Token与Project ID不匹配报错 - 语音交互服务 SIS

Token与Project ID不匹配报错获取Token时，出现the parameters of requesting token are wrong or project_id doesn't match the token报错。检查获取Token过程中，请求url中的区域信息与获取

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
调用说明 - 语音交互服务 SIS
调用说明 - 语音交互服务 SIS

调用说明 SIS服务提供了两种接口，包含REST（Representational State Transfer）API，支持您通过HTTPS请求调用，调用方法请参见如何调用REST API。也包含WebSocket接口，支持Websocket协议，调用方法请参见如何调用WebSocket

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
数据保护技术 - 语音交互服务 SIS

数据保护技术在使用语音交互服务过程中委托我们处理的语音音频和文本等数据，您完全拥有上述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将在中华人民共和国境内处理

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
获取项目ID - 语音交互服务 SIS
获取项目ID - 语音交互服务 SIS

获取项目ID 从控制台获取项目ID 登录管理控制台。在控制台中，鼠标移动至右上角的用户名处，在下拉列表中选择“我的凭证”。图1 我的凭证入口在“我的凭证”页面，可以查看用户名、账号名，在项目列表中查看项目。图2 查看项目ID 多项目时，展开“所属区域”，从“项目ID”列获取子项目

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
与其他云服务的关系 - 语音交互服务 SIS

与其他云服务的关系 SIS服务与周边其他服务的关系如图1所示。图1 SIS与其他服务的关系图统一身份认证服务统一身份认证（Identity and Access Management，简称IAM）服务，IAM为语音交互服务提供了用户认证和鉴权功能。对象存储服务 SIS服务接口支持从对象存储服务

 帮助中心 > 语音交互服务 SIS > 产品介绍
获取AK/SK - 语音交互服务 SIS
获取AK/SK - 语音交互服务 SIS

获取AK/SK 如果已生成过AK/SK，则可跳过此步骤，找到原来已下载的AK/SK文件，文件名一般为：credentials.csv。如下图所示，文件包含了租户名（User Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv

帮助中心 > 语音交互服务 SIS > API参考 > 附录
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
配置OBS访问权限 - 语音交互服务 SIS

配置OBS访问权限 OBS服务 OBS全称Object Storage Service（对象存储服务），提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用成本

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
语音交互服务需要申请什么权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限语音交互服务本身无权限限制，用户不需要额外添加任何权限，即可对语音交互服务执行操作。但是如下场景除外：当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别单句模式功能介绍单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
状态码 - 语音交互服务 SIS
状态码 - 语音交互服务 SIS

状态码表1 状态码状态码说明 100 Continue 101 Switching Protocols 200 OK 201 Created 202 Accepted 203 Non-Authoritative Information 204 NO Content 205 Reset

帮助中心 > 语音交互服务 SIS > API参考 > 附录
Websocket握手请求 - 语音交互服务 SIS

Websocket握手请求功能介绍本接口提供实时流式语音合成。用户每次建立连接，发送待合成文本，服务端将合成结果响应给用户。一次连接只能发送一次文本，如果有多段文本需要合成，需要多次建立连接。实时语音合成和语音合成均属于语音合成接口，采用完全相同的计费规则，两者价格梯度可互相叠加

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后返回

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口

总条数： 106

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音交互服务使用简介 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

公共请求参数 - 语音交互服务 SIS

API概览 - 语音交互服务 SIS

Token与Project ID不匹配报错 - 语音交互服务 SIS

调用说明 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

获取项目ID - 语音交互服务 SIS

与其他云服务的关系 - 语音交互服务 SIS

获取AK/SK - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

状态码 - 语音交互服务 SIS

Websocket握手请求 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线