检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String 是 OBS桶名称,全局唯一,用于上传wav语音文件。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.)。 result_bucket_name String 是 OBS桶名称,全局唯一,用于存放语音识别结果。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(
什么是人脸识别 人脸识别服务(Face Recognition Service,简称FRS),是基于人的脸部特征信息,利用计算机对人脸图像进行处理、分析和理解,进行身份识别的一种智能服务。人脸识别以开放API(Application Programming Interface,应
0002", "error_msg": "***" } 状态码 状态码请参见状态码。 错误码 错误码请参见错误码。 父主题: 实时语音识别响应
附录 名词解释 基本概念、云服务简介、专有名词解释 语音交互服务SIS:以API的形式,对外提供语音转文本以及文本转语音的服务。 函数工作流 FunctionGraph:FunctionGraph是一项基于事件驱动的函数托管计算服务。使用FunctionGraph函数,只需编写业
方案概述 应用场景 该解决方案是华为云语音交互服务SIS基于FunctionGraph开发的一套客服中心语音质检工作流。帮助您迈出传统行业向数字化转型的第一步,使用智能语音交互提高客服中心语音质检覆盖率和效率。适用于以下需求场景: 电商领域客服服务过程异常检测; 电销领域违规、投诉、专项检测;
选择连接模式,目前实时语音识别提供三种接口,流式一句话、实时语音识别连续模式、实时语音识别单句模式 // 选择1 流式一句话连接 // rasrClient.shortStreamConnect(request); // 选择2,实时语音识别单句模式
一句话识别 支持“华北-北京四”、“华东-上海一”区域。 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
录音文件识别接口 提交录音文件识别任务 获取录音文件识别结果
sentence_stream_connect(request) # 实时语音识别单句模式 rasr_client.continue_stream_connect(request) # 实时语音识别连续模式 # use enterprise_project_Id
身份证信息核验请使用人证核身服务。 图1 身份证示例图 身份证识别支持中华人民共和国居民身份证识别。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持中华人民共和国居民身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。
API参考文档中的“audio_format取值范围”。 语音时长不超过5小时,文件大小不超过300M,用户的识别任务在6小时内完成并返回识别结果,识别结果保存72小时(从转写完成的时间算起)。 支持中文普通话、四川话识别。 父主题: 约束与限制
开始语音合成请求 功能介绍 客户端与语音合成引擎建立Websocket连接后,可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求,需在每次请求重新建立websocket连接,一次连接只能处理一次合成请求。 请求消息 表1 参数说明 名称 参数类型
录音文件识别极速版接口 功能介绍 录音文件识别极速版接口,用于录音文件的同步识别。音频需要上传华为云OBS,提供华为云OBS对象地址,能快速返回识别结果。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
实施步骤 准备工作 快速部署 开始使用 快速卸载
一句话识别 http接口 websocket接口
与实时语音识别引擎握手连接,并发送语音数据和接收转写结果,最后关闭Websocket连接。 获取Websocket握手请求wss-URI请参见Websocket握手请求。 获取实时语音识别请求消息格式信息请参见实时语音识别请求。 获取实时语音识别响应消息格式请参见实时语音识别响应。
S桶中获取结果,即可实现隐私通话内容的自动化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例 客服中心语音质检结果如下所示,支持语音识别结果、原始录音文件地址、录音时长、规则命中结果、命中位置等多个字段。 { 'asr_result': {
致的文本。 LEFT_AGENT 登录华为云解决方案实践,选择“语音识别-客服中心语音质检”模板,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,参考表1完成自定义参数填写,单击“下一步”。
修订记录 发布日期 修订记录 2022-11-30 第一次正式发布。 2023-03-09 修订实施步骤。 2024-09-18 适配函数工作流EventGrid触发器。
实时语音识别多人同时使用,如何区分各自识别结果 每个用户独立建立websocket连接,不可共用一个websocket连接。 父主题: API使用类