小i机器人智能语音服务-
版本: V1.0 | 交付方式: License |
适用于: Linux | 上架日期: 2022-06-23 02:37:48 |
语音识别,即Automatic Speech Recognition,简称ASR,提供将语音转写成文本的能力。通过WEB接口,为各类调用端提供短音频识别、 实时语音识别 、录音文件转写等功能。能够自动保存日志,包括,供运维分析。
短音频识别。用于语音搜索、语音指令、语音短消息等较短的语音识别场景。
实时语音识别。适用于会议、庭审、 语音助手 等长时间不间断识别的场景。
录音文件转写。适用于电话质检等离线长录音文件识别场景。
语音合成,即Text to Speech,简称 TTS ,提供将文本合成为语音的能力。通过WEB接口,为各类调用端提供文本语音文件合成、实时语音合成、长文本音文件合成等功能。TTS支持多个音库,可根据使用场景选择;支持SSML,可对播报效果按需进行调整。
语音文件合成。适用于各类较短文本需要人工合成音频的场景。
实时语音合成。适用于数字人等对话中实时合成音频的场景。
长文本音文件合成。适用于听书、视频配音等较长文本合成音频的场景。
引擎服务端能够自动保存日志,包括识别和合成的音频文件,供运维分析。
独立许可管理服务支持授权漂移,保证单台故障不影响整体使用。