短 语音识别 将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等 语音交互 识别场景。
产品特性
效果出众:使用深度学习技术,语音识别准确率超过95%,在业界具有一定的技术优势。
稳定可靠:成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验。
简单易用:提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出。
语音识别:支持短语音,实时将语音转换成文字。
语言支持:支持中文普通话,含带方言口音的普通话识别。
多语言格式支持:支持7种以上的输入语音格式。
应用场景
语音搜索:搜索内容直接以语音的方式输入,让搜索更加高效。支持各种场景下的语音搜索,比如地图导航、网页搜索等。
人机交互:通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验。