正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OBS桶名称,全局唯一,用于存放隐私通话质检识别结果。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.) 空 登录华为云解决方案实践,选择“语音识别-客服中心语音质检”模板,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2
00101" }, "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
实时语音识别连续模式 前提条件 确保已经按照配置好iOS开发环境。 初始化Client 初始化RASRClient,参数为AuthInfo和RASRConfig。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,可参考AK/SK认证。
资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,具体请参考华为云官网价格,实际以收费账单为准: 表1 资源和成本规划(按需计费) 华云服务 配置示例 每月预估花费 语音交互服务 区域:华北-北京四 计费模式:按需计费 涉及服务:录音文件识别 录音文件识别:2.5元/小时
快速卸载 在进行卸载之前,需要先删除该方案创建的委托。 一键卸载 登录隐私通话解决方案部署页面。 单击方案资源栈后的“删除”。 图1 一键卸载 在弹出的删除资源栈确认框中,输入“Delete”,单击“确认”,即可卸载解决方案。 图2 删除资源栈确认 父主题: 实施步骤
开始使用 登录华为云对象存储服务控制台,查看自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储语音文件的桶“wwwy-1”(实际桶名称以部署指定参数为准),上传wav语音文件。 图2 上传语音文件 选择用于存放结果的“wwwy-2”桶(实际桶名称以部署指定参数
准备工作 该解决方案部署,需要开通、配置以下授权。 购买、配置语音交互服务录音文件识别 登录语音交互服务,选择录音文件识别,单击购买录音识别套餐包。 图1 登录语音交互服务 图2 购买录音套餐 选择服务授权,开通对象服务授权。 图3 开通对象服务授权 创建rf_amdin_trust委托
错误码定义 CC-Gateway返回结果码 订阅语音识别结果接口通用返回结果码 CTI返回通用错误码 CTI返回VDN配置接口错误码 CTI返回系统配置接口错误码 UAP返回错误码 父主题: 订阅语音识别结果接口
请求参数 无 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
29:全屏质检 30:同组代答 31:已废弃 32:配置业务代表 33:配置技能 34:不可填写外呼主叫 35:配置审计 父主题: 订阅语音识别结果接口
如何查看实时语音识别的中间结果 实时语音识别分为开始识别、发送音频数据、结束识别,断开连接四个阶段。在使用API或SDK时,可以通过将interim_results参数设置为yes,将识别过程的中间结果返回。如果设置为no,则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。
准备工作 语音交互服务开通授权 登录语音交互服务,在控制台左上角选择区域为“北京四”,左侧菜单选择服务授权,打开对象存储服务授权。如之前已打开过授权,如图1,则无需操作。 图1 打开对象存储服务授权 创建rf_amdin_trust委托 登录华为云控制台,打开“统一身份认证”菜单。
String(1-128) 无 通知语音的放音文件名。需要先通过放音文件管理页面上传放音文件并通过审核才能使用。 当前系统只支持Wave格式的音频文件,文件如“notifyvoice.wav”。 该参数和templateId是二选一的关系,即两个参数必须携带其中一个。 templateId
是否支持aac格式的语音文件转文字 一句话识别和录音文件识别以及实时语音识别均可实现语音转文字,一句话识别支持aac格式,录音文件识别和实时语音识别不支持aac格式。 父主题: 产品咨询类
实时语音识别多人同时使用,如何区分各自识别结果 每个用户独立建立websocket连接,不可共用一个websocket连接。 父主题: API使用类
如何使用Websocket调用实时语音识别 解决方案 1. 下载Java SDK 或 Python SDK,参考《SDK参考》中获取SDK章节。 2. 配置SDK环境,参考《SDK参考》中配置Java环境。 3. 使用SDK里的demo进行调用。参考Java SDK和Python
交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 语音交互(实时语音识别、一句话识别、录音文件识
Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检
什么是人脸识别 人脸识别服务(Face Recognition Service,简称FRS),是基于人的脸部特征信息,利用计算机对人脸图像进行处理、分析和理解,进行身份识别的一种智能服务。人脸识别以开放API(Application Programming Interface,应
语音识别是强制绑定使用OBS进行录音文件存储吗 不是,只有录音文件识别需要使用OBS服务,语音交互服务对用户存储在OBS的数据,具有只读权限,没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据,需要用户根据自己的obs桶的使用情况或者容量大小确认,并在OBS服务上执行。