语音交互服务_SIS_华为云

语音交互服务

产品列表

实时语音识别 RASR

实时语音识别（Real-time ASR），将连续的音频流实时转换成文本，语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

实时语音识别（Real-time ASR），将连续的音频流实时转换成文本，语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

了解更多
一句话识别 SASR

一句话识别将口述音频转换为文本，通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

一句话识别将口述音频转换为文本，通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

了解更多

录音文件识别 LASR

录音文件识别，基于深度学习技术，可以实现5小时以内的音频到文字的转换。支持垂直领域定制，对应领域转换效果更佳。

录音文件识别，基于深度学习技术，可以实现5小时以内的音频到文字的转换。支持垂直领域定制，对应领域转换效果更佳。

了解更多
语音合成 TTS

语音合成服务提供在线语音合成能力，支持将文本信息实时转化为近似的真人发声，支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

语音合成服务提供在线语音合成能力，支持将文本信息实时转化为近似的真人发声，支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

了解更多

录音文件识别极速版

录音文件识别极速版，音频转文字速度大幅提升

录音文件识别极速版，音频转文字速度大幅提升

了解更多
实时语音合成

实时流的语音合成服务

实时流的语音合成服务

了解更多

如您对语音交互服务仍有疑问，请点击右侧按钮，技术专家将为您提供专业解决方案→

获取方案

产品动态

帮助文档