搜索_华为云

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果每个用户独立建立websocket连接，不可共用一个websocket连接。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

不同。目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音交互服务使用简介 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时

 帮助中心 > 语音交互服务 SIS > 快速入门
录音文件识别 - 语音交互服务 SIS

录音文件识别支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
录音文件识别极速版 - 语音交互服务 SIS

录音文件识别极速版支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
语音交互服务的区域如何选择 - 语音交互服务 SIS

续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。父主题：区域与可用区

 帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
实时语音识别单句模式 - 语音交互服务 SIS

将当前这一段的识别结果返回。和连续识别不同的是，在单句模式下，返回第一段的识别结果后，将不再继续识别后续的音频。这主要是用于和用户进行语音交互的场景下，当用户说完一句话后，往往会等待后续的交互操作，例如聆听根据识别结果播报的相关内容，因而没有必要继续识别后续的音频。 wss-URI

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

用户需要识别的音频文件。解决方案检查用户是否授权服务访问OBS。检查存放音频的OBS的Region和服务的Region是否为同一区域，只有同一区域的OBS才能正常访问。检查音频的OBS URI是否正确。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成的base64编码如何使用 - 语音交互服务 SIS

语音合成的base64编码如何使用问题现象用户在使用语音合成获取响应体的base64编码，不了解应该如何进一步使用。解决方案 1. 建议用户使用Java或Python SDK，可参考SDK简介。 2. 使用html网页播放，新建一个html文件，如下填写内容，即可在浏览器播放。 <audio controls="controls"

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

使用SDK调用录音文件识别时一直返回"SIS.0535"，错误信息显示为："Audio format is invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

will not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
什么是语音交互服务 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API（Application Programming Interface，应用程序编程接口）获取语音交互结果。例如用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

于实时语音识别。音频分片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明一句话识别一句话识别接口，用于短语音的同步识别。一次性上传整个音频，响应中即返回识别结果。表3 录音文件识别接口说明接口类型说明录音文件识别

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
准备数据 - 语音交互服务 SIS
准备数据 - 语音交互服务 SIS

准备数据数据要求受技术与成本多种因素制约，SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。

帮助中心 > 语音交互服务 SIS > 用户指南
开始语音合成请求 - 语音交互服务 SIS

可参考表3和表4。默认：chinese_xiaoyan_common 实时语音合成和语音合成属于同一种资源，按次计费。实时语音合成普通发音人，每100字计一次。精品发音人每50字计一次。 speed Integer 否语速。取值范围：-500~500 默认值：0 pitch Integer

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > SDK参考
认证鉴权 - 语音交互服务 SIS
认证鉴权 - 语音交互服务 SIS

调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证通用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key)加密调用请求。 Token认证 Token的有效期为24小时，需要使用同一个Token鉴权时，可以缓存起来，避免频繁调用。

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
发送音频数据 - 语音交互服务 SIS

在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间，建议在需要实时反馈的情况下100ms，不需要实时反

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求

总条数： 121

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

语音合成的base64编码如何使用 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

准备数据 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

认证鉴权 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线