语音识别解决方案_文本检索_方言口音识别-华为云

该解决方案有何用途？

该解决方案基于华为云语音交互服务 SIS语音识别构建，可自动将用户上传到对象存储服务 OBS的wav语音文件转化为文字，并将结果存放到指定对象存储服务 OBS桶。该方案可以将用户上传在对象存储服务 OBS的语音文件识别成可编辑的文本，支持中文普通话的识别和合成，其中语音识别还支持带方言口音的普通话识别以及方言（四川话、粤语和上海话）的识别。适用于如下场景：识别客服、客户的语音，进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录等场景。

方案架构

该方案基于华为云语音交互服务 SIS语音识别构建，可自动将用户上传到对象存储服务 OBS的wav语音文件转化为文字。

语音识别解决方案

版本：1.0.0

上次更新日期：2025年3月

来源：由华为云构建

部署：预计10分钟

卸载：预计10分钟

预估花费◥

查看源代码 ◥

查看部署指南

架构描述

架构描述

创建两个对象存储服务 OBS桶，一个用于用户上传和存储用户的语音文件，另一个用于存储语音识别结果，用户可以从该桶中获取结果并处理
使用函数工作流 FunctionGraph，只需编写业务函数代码并设置运行的条件，即可以弹性、免运维、高可靠的方式运行
使用语音交互服务 SIS，将wav语音文件转化为文字
创建一个EventGrid触发器，该触发器关联事件网格 EG，默认创建一个事件订阅，事件源为OBS应用事件源，用于自动触发函数执行相关业务逻辑

展开内容

收起内容

方案优势

高识别率

稳定可靠

可定制化