该解决方案有何用途?

该解决方案基于华为云语音交互服务 SIS语音识别构建,可自动将用户上传到对象存储服务 OBS的wav语音文件转化为文字,并将结果存放到指定对象存储服务 OBS桶。该方案可以将用户上传在对象存储服务 OBS的语音文件识别成可编辑的文本,支持中文普通话的识别和合成,其中语音识别还支持带方言口音的普通话识别以及方言(四川话、粤语和上海话)的识别。适用于如下场景:识别客服、客户的语音,进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。对会议记录的音频文件,进行快速的识别,转化成文字,方便进行会议记录等场景。

方案架构

该方案基于华为云语音交互服务 SIS语音识别构建,可自动将用户上传到对象存储服务 OBS的wav语音文件转化为文字。

语音识别解决方案

版本:1.0.0

上次更新日期:2023年4月

来源:由华为云构建

部署:预计10分钟

卸载:预计10分钟

架构描述


该方案会部署如下资源:


1. 创建两个对象存储服务 OBS桶,一个用于用户上传和存储用户的语音文件,另一个用于存储语音识别结果,用户可以从该桶中获取结果并处理。


2. 函数工作流 FunctionGraph,只需编写业务函数代码并设置运行的条件,即可以弹性、免运维、高可靠的方式运行。


3. 语音交互服务 SIS,将wav语音文件转化为文字。

架构描述


该方案部署如下资源:


1. 创建两个对象存储服务 OBS桶,一个用于用户上传和存储用户的语音文件;另一个用于存储语音识别结果,用户可以从该桶中获取结果并处理。


2. 函数工作流 FunctionGraph,只需编写业务函数代码并设置运行的条件,即可以弹性、免运维、高可靠的方式运行。


3. 语音交互服务 SIS,将wav语音文件转化为文字。

展开内容
收起内容