搜索_华为云

语音交互服务使用简介 - 语音交互服务 SIS

户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景

 帮助中心 > 语音交互服务 SIS > 快速入门
什么是语音交互服务 - 语音交互服务 SIS

Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

帮助中心 > 语音交互服务 SIS > 产品介绍
语音交互服务需要申请什么权限 - 语音交互服务 SIS

当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object Storage Service，对象存储服务）桶中。考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取

 帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

请求什么类型的操作。 GET：请求服务器返回指定资源。 PUT：请求服务器更新指定资源。 POST：请求服务器新增资源或执行特殊操作。 DELETE：请求服务器删除指定资源，如删除对象等。 HEAD：请求服务器资源头部。 PATCH：请求服务器更新资源的部分内容。当资源不存在的时

 帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
如何查看当前接口是否免费调用 - 语音交互服务 SIS

如何查看当前接口是否免费调用计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数。

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

计费说明计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数。调用热词接口，不单独计费。

帮助中心 > 语音交互服务 SIS > 产品介绍
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明一句话识别一句话识别接口，用于短语音的同步识别。一次性上传整个音频，响应中即返回识别结果。表3 录音文件识别接口说明接口类型说明录音文件识别录音文件识别接口，

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
配置OBS访问权限 - 语音交互服务 SIS

Administrator权限的子账号才可以创建委托。上传音频在OBS“桶列表”页，单击创建的OBS桶。图2 进入OBS桶进入“对象”页面，将音频数据上传至OBS桶中。图3 上传视频数据获取音频URL 单击已上传的数据名称，进入数据详情页。图4 进入数据详情页复制链接，获取数据URL。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。支持中文、英文、中英文，文本不长于500个字符。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
严重错误响应 - 语音交互服务 SIS

严重错误响应功能介绍严重错误，通常指流程无法继续的情况。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示此次合成发生不可恢复的错误。 trace_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

为什么服务端返回OBS链接不可用（data url is unreachable）问题现象服务后台无法访问用户提供的音频的OBS链接。即无法获取用户需要识别的音频文件。解决方案检查用户是否授权服务访问OBS。检查存放音频的OBS的Region和服务的Region是否为同一区域，只有同一区域的OBS才能正常访问。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
获取AK/SK - 语音交互服务 SIS
获取AK/SK - 语音交互服务 SIS

找到原来已下载的AK/SK文件，文件名一般为：credentials.csv。如下图所示，文件包含了租户名（User Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：登录管理控制台。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
修订记录 - 语音交互服务 SIS
修订记录 - 语音交互服务 SIS

2023-03-06 新增： CPP SDK支持Linux版本 2022-08-02 新增： Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP SDK新增实时语音合成 2022-07-07 新增：获取录音文件识别结果API支持返回提交音频的时长。 CPP

帮助中心 > 语音交互服务 SIS > SDK参考
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音交互服务的区域如何选择 - 语音交互服务 SIS

域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。父主题：区域与可用区

 帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
实时语音识别 - 语音交互服务 SIS

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。音频采样率8KHz或者16KHz，采样位数8bit或者16bit。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制

总条数： 108

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音交互服务使用简介 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

获取AK/SK - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

修订记录 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线