检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用实时语音识别 前提条件 确保已按照配置CPP环境(Windows)配置完毕。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化RasrClient,其参数包括AuthInfo。
文字转语音:通过文字转语音方式生成的TTS放音文件, 需要已经配置TTS通道。您可以通过开启TTS高级设置,设置放音参数。单击下拉列表框的“”可以选择音效和音速。若不开启,默认音效:女生朗读,音速:低速朗读,无TTS扩展参数。 音效:选择放音音效,可选男生朗读和女生朗读。
如何开通语音质检? 新增应用:登录隐私保护通话控制台添加应用时,“是否开通录音”和“是否开通语音质检”都选择“是”即可开通。
接口类型 表1 接口类型说明 请求方法 POST 访问URI 开发者应用接收呼叫状态URL 通信协议 HTTPS/HTTP 请求参数 SP调用语音通知API,语音通话平台发起呼叫,给用户播放自定义的语音文件或TTS合成语音文件,并可进行收号,获得应答信息并反馈给SP。
添加语音模板 语音通话支持自定义语音模板,语音模板需要提前到语音通话平台提交并通过审核后才可使用。 进入语音通话控制台,点击“语音模板管理”。 点击右上角“添加语音模板”,开始添加。 填写模板名称、设置语音播放速度、模板内容及业务场景。 模板内容必须以汉字开头。 点击“确认”。
特点是操作比较简便,播放的语音通知是原音。 语音模板需要先通过语音模板管理页面提交模板并审核通过后才能使用,并获取对应的模板ID。调用语音通知API时携带模板ID和模板的变量值列表。特点是可以灵活配置参数,播放的语音通知是青年女声的电子音。 父主题: 放音文件及语音模板配置
“模板类型”选择“TTS”后,其中集成环境的“模板内容”是通过弹窗表格进行选择,需要您先在“配置中心 > 资源管理 > 音视频资源管理”中新增文字转语音类型的一条文本,提交审核,系统管理员审核通过后才可在弹窗表格中选择。弹窗表格中仅展示当前语种的IVR语音文件名称。
本解决方案提供的测试样例由华为云语音交互服务语音合成服务生成,仅用于demo演示。 卸载解决方案前,请先确保OBS桶中无数据,否则解决方案将卸载失败。
PHP 样例 语音通知API、呼叫状态通知API、话单通知API 环境要求 PHP 7.0及以上版本。 引用库 - 本文档所述Demo在提供服务的过程中,可能会涉及个人数据的使用,建议您遵从国家的相关法律采取足够的措施,以确保用户的个人数据受到充分的保护。
创建语音通知(V1.0.0)(createVoiceNotification) 场景描述 使用语音通知功能时,调用此API,将请求语音通话平台给指定用户播放语音通知。
文字转语音:通过文字转语音方式生成的TTS放音文件, 需要已经配置TTS通道。您可以通过开启TTS高级设置,设置放音参数。单击下拉列表框的“”可以选择音效和音速。若不开启,默认音效:女生朗读,音速:低速朗读,无TTS扩展参数。 音效:选择放音音效,可选男生朗读和女生朗读。
{"recordFileDownloadUrl", ""}, //录音文件下载地址(仅语音回呼场景携带) {"ttsPlayTimes", 0}, //应用TTS功能时,使用TTS的总次数
附录 名词解释 基本概念、云服务简介、专有名词解释 语音交互服务SIS:以API的形式,对外提供语音转文本以及文本转语音的服务。 函数工作流 FunctionGraph:FunctionGraph是一项基于事件驱动的函数托管计算服务。
若需使用通话录音功能,请确认已向语音通话平台申请该功能。
图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。 父主题: 计费咨询
Python 样例 语音回呼场景API、获取录音文件下载地址API、呼叫状态通知API、话单通知API 环境要求 Python 3.0及以上版本。 引用库 requests 2.18.1 请自行下载安装Python 3.x,并完成环境配置。
语音验证码呼叫状态通知API 接口功能 语音通话平台通过此接口向客户推送语音通话业务用户呼叫时的状态信息,如呼入、呼出、振铃、应答、挂机等状态的信息。
'', #存放录音文件的域名(仅语音回呼场景携带) 'recordFileDownloadUrl': '', #录音文件下载地址(仅语音回呼场景携带) 'ttsPlayTimes': 0, #应用TTS功能时,使用TTS的总次数
实时语音识别引擎的单句识别模式,和连续识别模式类似,也会进行语音的端点检测,如果检测到静音,将直接丢弃,检测到语音才会馈入核心进行实际的解码工作,如果检测到一段语音的结束点,就会将当前这一段的识别结果返回。
语音模板内容支持小数吗? ${TXT_数字}支持小数。 ${TXT_数字}:表示变量为定义相应长度的字符串,数字表示该字符串的最大长度,如${TXT_9}表示最大长度为9的字符串。 父主题: 放音文件及语音模板配置