检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
wav”。特点是操作比较简便,播放的语音通知是原音。 语音模板需要先通过语音模板管理页面提交模板并审核通过后才能使用,并获取对应的模板ID。调用语音通知API时携带模板ID和模板的变量值列表。特点是可以灵活配置参数,播放的语音通知是青年女声的电子音。 父主题: 放音文件及语音模板配置
语音通知话单通知API 接口功能 用户通话结束后,语音通话平台通过此接口向SP推送通话的话单信息。短时间内有多个通话结束时语音通话平台会将话单合并推送,每条消息最多携带50个话单。 请求方向 语音通话平台(客户端) → 客户服务器(服务端) 使用说明 前提条件 SP在开发应用时,
语音合成后输出的音频格式是什么 语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。 语音合成(Text To Speech ,TTS服务)服务的音频格式则根据接口中audi
如何开通语音质检? 新增应用:登录隐私保护通话控制台添加应用时,“是否开通录音”和“是否开通语音质检”都选择“是”即可开通。 已添加的应用:登录隐私保护通话控制台,点击“应用管理”,选择需要修改的应用,点击“操作”列下方的“修改”,“是否开通录音”和“是否开通语音质检”都选择“是”即可开通。
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。
语音回呼场景API 典型场景 当应用要实现语音回呼功能时,可以调用语音回呼场景API。 接口功能 主叫用户通过应用拨打被叫用户,语音通话平台呼叫主叫和被叫,使主叫和被叫能够互相通话。 图1 语音回呼体验流程 语音回呼业务体验描述: 用户A通过应用呼叫用户B,请求上报到SP。 SP调用语音回呼场景API。
文字识别SDK简介 文字识别SDK概述 文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。 文字识别以开放API(Application
语音合成结果响应 音频流数据 时间戳数据 父主题: 实时语音合成响应
语音合成结束响应 功能介绍 当合成引擎处理完合成请求后,会发送合成结束响应。客户端收到该响应后关闭当前Websocket链接即可。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为END,表示语音合成结束。 trace_id String
语音合成错误响应 功能介绍 合成引擎处理合成请求时如果发生错误则返回该响应。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为ERROR,表示错误响应。 trace_id String 服务内部的令牌,可用于在日志中追溯具体流程。
可定制化 针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确。 录音文件识别 对于录制的长语音进行识别,转写成文字,提供不同领域模型,具备良好的可扩展性,支持热词定制。 产品优势 高识别率 基于深度学习技术,对特定领域场景的语音识别进行优化,识别率达到业界领先。 稳定可靠
一个语音通知可以播放几个语音文件?格式是什么? 一个语音通知最多可以播放5个语音文件,这些文件的格式可以是TTS文本或音频文件。详情请查看语音通知API。 父主题: 放音文件及语音模板配置
开始合成响应 功能介绍 语音合成引擎收到实时语音合成请求时,首先向客户端发送合成开始响应,表示开始处理语音合成请求。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为START,表示开始语音合成。 trace_id String
实时语音合成响应 开始合成响应 语音合成结果响应 语音合成结束响应 语音合成错误响应 严重错误响应 父主题: 实时语音合成接口
语音通知可以设置播放多遍吗,如何设置? 语音通知可以设置播放多遍。在调用语音通知API时通过收号语音提示和以下参数配合使用。 示例 下面以设置当用户根据收号语音提示按“1”时重复播放语音通知为例,说明如何设置语音通知重复播放: 上传包含触发重新放音的收号内容的语音文件(notif
语音模板内容支持小数吗? ${TXT_数字}支持小数。 ${TXT_数字}:表示变量为定义相应长度的字符串,数字表示该字符串的最大长度,如${TXT_9}表示最大长度为9字节的字符串。 父主题: 放音文件及语音模板配置
语音回呼话单通知API 接口功能 用户通话结束后,语音通话平台通过此接口向SP推送通话的话单信息。短时间内有多个通话结束时语音通话平台会将话单合并推送,每条消息最多携带50个话单。 请求方向 语音通话平台(客户端) → 客户服务器(服务端) 使用说明 前提条件 SP在开发应用时,
开发者应用接收呼叫状态URL 通信协议 HTTPS/HTTP 请求参数 SP调用语音通知API,语音通话平台发起呼叫,给用户播放自定义的语音文件或TTS合成语音文件,并可进行收号,获得应答信息并反馈给SP。 注:以下流程以语音通话平台呼叫A,给A播放语音文件并收号为例。流程和接口示例仅供参考,请以实际消息为准。
方案概述 应用场景 该解决方案是华为云语音交互服务SIS基于FunctionGraph开发的一套客服中心语音质检工作流。帮助您迈出传统行业向数字化转型的第一步,使用智能语音交互提高客服中心语音质检覆盖率和效率。适用于以下需求场景: 电商领域客服服务过程异常检测; 电销领域违规、投诉、专项检测;
语音验证码话单通知API 接口功能 用户通话结束后,语音通话平台通过此接口向SP推送通话的话单信息。短时间内有多个通话结束时语音通话平台会将话单合并推送,每条消息最多携带50个话单。 请求方向 语音通话平台(客户端) → 客户服务器(服务端) 使用说明 前提条件 SP在开发应用时