检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
实施步骤 准备工作 快速部署 开始使用 快速卸载
语音识别-隐私通话内容分析 语音识别-隐私通话内容分析 查看部署指南 方案咨询 该解决方案有何用途? 该解决方案基于华为云语音交互服务 SIS及函数工作流 FunctionGraph,构建一套隐私通话内容分析工作流。
接口说明 实时语音识别接口基于Websocket协议实现。分别提供了“流式一句话”、“实时语音识别连续模式”、“实时语音识别单句模式”三种模式。 三种模式的握手请求wss-URI不同,基于Websocket承载的实时语音识别请求和响应的消息格式相同。
结果示例 客服中心语音质检结果如下所示,支持语音识别结果、原始录音文件地址、录音时长、规则命中结果、命中位置等多个字段。
LEFT_AGENT 登录华为云解决方案实践,选择“语音识别-客服中心语音质检”模板,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,参考表1完成自定义参数填写,单击“下一步”。
资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,具体请参考华为云官网价格,实际以收费账单为准: 表1 资源和成本规划(按需计费) 华云服务 配置示例 每月预估花费 语音交互服务 区域:华北-北京四 计费模式:按需计费 涉及服务:录音文件识别 录音文件识别:2.5
如何查看实时语音识别的中间结果 实时语音识别分为开始识别、发送音频数据、结束识别,断开连接四个阶段。在使用API或SDK时,可以通过将interim_results参数设置为yes,将识别过程的中间结果返回。如果设置为no,则会等每句话完毕才会返回识别结果。
修订记录 发布日期 修订记录 2022-11-30 第一次正式发布。 2023-03-09 修订实施步骤。 2024-09-18 适配函数工作流EventGrid触发器。
快速卸载 登录资源编排服务 RFS,进入“资源栈”,选择创建的资源栈名称,单击“删除”。 图1 一键卸载 在弹出的删除资源栈确认框中,输入“Delete”,单击“确定”,即可卸载解决方案。 图2 删除资源栈确认 父主题: 实施步骤
图1 获取事件通道ID 语音交互服务开通授权 登录语音交互服务控制台,在控制台左上角选择区域为“北京四”,左侧菜单选择服务授权,打开对象存储服务授权。如之前已打开过授权,如图1,则无需操作。
Websocket握手请求 流式一句话 实时语音识别连续模式 实时语音识别单句模式 父主题: 实时语音识别接口
语音交互服务使用简介 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。
订阅语音识别结果接口 调用订阅语音识别结果接口前,需要进行如下操作。 联系系统管理员为租间开启智能座席特性,并以租户管理员登录AICC,开启“ > 呼叫中心配置 > 基本信息”中的智能识别特性。
其中: LEFT_AGENT 指定左声道语音为agent(坐席)。 RIGHT_AGENT 指定右声道为agent(坐席)。 emotion 否 Boolean 是否需要做情绪检测,默认为true。仅对audio_format格式中采样率为8k的音频有效。
请确保音频位宽为16bit,目前仅支持16bit位宽的音频,如果低于该位宽的音频,则无法正常识别。 父主题: API使用类
服务公告 全部公告 > 产品公告 > 华为云语音交互服务-定制语音识别-录音文件识别于2019年8月9日00:00(北京时间)转商通知 华为云语音交互服务-定制语音识别-录音文件识别于2019年8月9日00:00(北京时间)转商通知 2019-08-01 尊敬的华为云客户: 华为云计划于
如何使用Websocket调用实时语音识别 解决方案 1. 下载Java SDK 或 Python SDK,参考《SDK参考》中获取SDK章节。 2. 配置SDK环境,参考《SDK参考》中配置Java环境。 3. 使用SDK里的demo进行调用。
faqId": 10001, "faqGroupId": 10000 } } } } 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
表6 WordsRegionList 参数 参数类型 描述 type String 文字识别区域类型。 text:文本识别区域; table:表格识别区域。 words_block_count Integer 子区域识别文字块数目。
车牌识别 功能介绍 识别输入图片中的车牌信息,并以JSON格式返回其坐标和内容。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车牌示例图 支持车牌信息、车牌颜色识别,支持双行车牌识别,支持单张图片内多个车牌识别。