检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 发布日期 修订记录 2022-11-30 第一次正式发布。 2023-03-09 修订实施步骤。 2025-01-06 适配函数工作流EventGrid触发器。
0101。 return_text_location 否 Boolean 识别到的文字块的区域位置信息。可选值包括: true:返回各个文字块区域 false:不返回各个文字块区域 如果无该参数,系统默认不返回文字块区域。如果输入参数不是Boolean类型,则会报非法参数错误。 响应参数
OBS桶名称,全局唯一,用于存放隐私通话质检识别结果。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.) 空 登录华为云解决方案实践,选择“语音识别-隐私通话内容分析”模板,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2
00101" }, "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
请求参数 无 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
示一句话结束,后续的音频将被忽略,不会再进行识别(连续模式可忽略)。 void onExcceededSilence(); 单句模式下,响应EXCEEDED_SILENCE事件,表示超过vad_head没有检测到声音,通常表示用户一直没有说话。此时后续的音频将被忽略,不会再进行识别(连续模式可忽略)。
详细使用流程可参考OBS SDK用户指南。 结果示例 隐私通话内容分析结果如下所示,支持语音识别结果、原始录音文件地址、录音时长、规则命中结果、命中位置等多个字段。 { 'asr_result': { 'status': 'FINISHED'
识别结果内容。取值类型为对象数组,对象数组参数说明如下: confidence:有效识别结果的可信度。 content:识别结果内容。该内容格式依赖AICC对接的ASR厂商定义的nlresult值,请根据具体返回格式进行适配。例如,本节样例报文中,该参数的值为AICC公有云场景下返回的格式“<nlresult
Websocket握手请求 流式一句话 实时语音识别连续模式 实时语音识别单句模式 父主题: 实时语音识别接口
开始使用 登录华为云对象存储服务控制台,查看自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储语音文件的桶“wwwy-1”(实际桶名称以部署指定参数为准),上传wav语音文件。 图2 上传语音文件 选择用于存放结果的“wwwy-2”桶(实际桶名称以部署指定参数
准备工作 该解决方案部署,需要开通、配置以下授权。 购买、配置语音交互服务录音文件识别 登录语音交互服务,选择录音文件识别,单击购买录音识别套餐包。 图1 登录语音交互服务 图2 购买录音套餐 选择服务授权,开通对象服务授权。 图3 开通对象服务授权 创建rf_amdin_trust委托
快速卸载 在进行卸载之前,需要先删除该方案创建的委托。 一键卸载 登录资源编排服务 RFS,进入“资源栈”,选择创建的资源栈名称,单击“删除”。 图1 一键卸载 在弹出的删除资源栈确认框中,输入“Delete”,单击“确定”,即可卸载解决方案。 图2 删除资源栈确认 父主题: 实施步骤
资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,具体请参考华为云官网价格,实际以收费账单为准: 表1 资源和成本规划(按需计费) 华云服务 配置示例 每月预估花费 语音交互服务 区域:华北-北京四 计费模式:按需计费 涉及服务:录音文件识别 录音文件识别:2.5元/小时
101" } 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
"801166010768953344" } 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
实时语音识别连续模式 前提条件 确保已经按照配置好iOS开发环境。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化RASRClient,参数为AuthInfo和RASRConfig。 表1 AuthInfo 参数名称 是否必选 参数类型 描述
请求参数 无 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
return_text_location 否 Boolean 识别到的文字块的区域位置信息。可选值包括: true:返回各个文字块区域 false:不返回各个文字块区域 如果无该参数,系统默认不返回文字块区域。如果输入参数不是Boolean类型,则会报非法参数错误。 响应参数
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认
准备工作 获取事件网格 EG云服务事件通道ID 进入华为云官网,打开控制台管理界面,打开事件网格,复制default通道ID。 图1 获取事件通道ID 语音交互服务开通授权 登录语音交互服务,在控制台左上角选择区域为“北京四”,左侧菜单选择服务授权,打开对象存储服务授权。如之前已打开过授权,如图1,则无需操作。