搜索_华为云

接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

接口说明实时语音识别接口基于Websocket协议实现。分别提供了“流式一句话”、“实时语音识别连续模式”、“实时语音识别单句模式”三种模式。三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、py

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
录音文件识别多久可以返回结果 - 语音交互服务 SIS

录音文件识别多久可以返回结果音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

TtsCustomizationClient初始化参数参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如：cn-north-4。具体请参考终端节点。 project_id

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音合成 - 语音交互服务 SIS

表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如cn-north-4，参考终端节点。 projectId 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如cn-north-4，参考终端节点。 projectId 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
如何使用Websocket调用实时语音识别 - 语音交互服务 SIS

如何使用Websocket调用实时语音识别解决方案 1. 下载Java SDK 或 Python SDK，参考《SDK参考》中获取SDK章节。 2. 配置SDK环境，参考《SDK参考》中配置Java环境。 3. 使用SDK里的demo进行调用。参考Java SDK和Python

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
APIG.0301报错 - 语音交互服务 SIS

0301"，是因为AK/SK认证失败。解决方案：（1）请检查AK/SK是否正确，AK对应的SK错误，不匹配；AK/SK中多填了空格；（2）AK/SK频繁出现鉴权出错，连续错误5次以上，被锁定5分钟（5分钟内，则一直认为其是异常的鉴权请求），5分钟后解锁重新认证；（3）检查账号权限，是否欠费，被冻结等账号。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
获取项目ID - 语音交互服务 SIS
获取项目ID - 语音交互服务 SIS

获取项目ID的接口为“GET https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点。接口的认证鉴权请参见认证鉴权。响应示例如下，例如，语音交互服务部署的区域为“cn-north-4”，响应消息体中查找“name”为“cn-north-4”

帮助中心 > 语音交互服务 SIS > API参考 > 附录
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
如何调用REST API - 语音交互服务 SIS

如何调用REST API 构造请求认证鉴权返回结果

 帮助中心 > 语音交互服务 SIS > API参考
Token怎么获取 - 语音交互服务 SIS

} 如下图所示，返回的响应消息头中“x-subject-token”就是需要获取的用户Token。获取Token之后，您就可以使用Token认证调用SIS服务API。获取Token后，再调用SIS服务API接口时，您需要在请求消息头中添加“X-Auth-Token”，其值即为To

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错问题描述识别文件错误，提示“The silence time is too long, and the audio will not

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

oken。 SIS.0102 鉴权信息缺失。请检查请求消息头中的X-Auth-Token是否存在。 SIS.0103 实名认证缺失。请进行账号实名认证。 SIS.0012 请求体中字段缺失。请检查请求参数是否缺失必须字段。 SIS.0031 请求参数不支持。请检查请求参数是否正确。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

终端节点终端节点即调用API的请求地址，不同服务不同区域的终端节点不同。目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
语音交互服务使用简介 - 语音交互服务 SIS

语音交互服务使用简介语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口

 帮助中心 > 语音交互服务 SIS > 快速入门
支持哪些语言 - 语音交互服务 SIS

支持哪些语言录音文件识别、语音合成支持中文普通话。一句话识别和实时语音识别支持中文普通话，带方言口音的普通话和方言（四川话、粤语和上海话）。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类

总条数： 134

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

接口说明 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

录音文件识别多久可以返回结果 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

如何使用Websocket调用实时语音识别 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

APIG.0301报错 - 语音交互服务 SIS

获取项目ID - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

如何调用REST API - 语音交互服务 SIS

Token怎么获取 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

支持哪些语言 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线