检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图3 配置告警通知 表3 配置告警通知 参数 参数说明 发送通知 配置是否发送短信、邮件、语音通知、HTTP、HTTPS、FunctionGraph(函数)、FunctionGraph(工作流)、企业微信、钉钉、飞书或Welink通知用户。
8007 给用户放音失败 8008 给用户放音收号失败,请在语音通知内容播放完毕后的5秒之内进行收号操作 8009 接通前主叫用户主动挂机 8010 超过通话最大时长挂机 8012 无效的app_key 8015 给用户录音失败 8017 用户指示挂机 8018 业务无权限 8020
需具体到文件,如D:/test.wav /** * 用于语音合成参数设置,例如发声人、音高、语速、音量、采样率、连接超时。所有参数均可以不设置,采用默认。
语音通知 语音通知支持设置以下提示音,放音文件审核通过后,调用“语音通知API”时,设置对应参数即可使用。如果不设置,则播放系统默认音。 放音 放音场景 设置参数 默认音 提示 语音通知的放音 用户接听平台来电后的语音通知内容。
语音合成结果响应 音频流数据 时间戳数据 父主题: 实时语音合成响应
父主题: 实时语音合成响应
添加资源模板 背景信息 表1 可添加的资源描述 模板类型 描述 配置前提 TTS 当“机器人回复图元”的回复方式为“回复文本”时,需要使用此处配置的资源,目的是将此处设置的文本信息通过TTS播放。 如果文本中包含参数,需要确保使用的参数在当前步骤有值。
父主题: 实时语音合成响应
华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过调用语音合成接口将文本转换成逼真的语音等。
文字转语音:通过文字转语音方式生成的TTS放音文件, 需要已经配置TTS通道。您可以通过开启TTS高级设置,设置放音参数。单击下拉列表框的“”可以选择音效和音速。若不开启,默认音效:女生朗读,音速:低速朗读,无TTS扩展参数。 音效:选择放音音效,可选男生朗读和女生朗读。
父主题: 语音合成结果响应
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.
使用实时语音合成 前提条件 确保已按照配置CPP环境(Linux)配置完毕。 请参考SDK(websocket)获取最新版本SDK包。
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。
时间戳数据 功能介绍 实时语音合成服务在生成音频流的同时,可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。 参数设置 设置请求参数subtitle为"word_level"或"phoneme_level"时,开启时间戳功能。
功能时,使用TTS的总次数 * 'ttsTransDuration': 应用TTS功能时,TTS Server进行TTS转换的总时长(单位为秒) * 'serviceType': 携带呼叫的业务类型信息 * 'hostName'
实时语音合成响应 开始合成响应 语音合成结果响应 语音合成结束响应 语音合成错误响应 严重错误响应 父主题: 实时语音合成接口
(可选)订购TTS&ASR。 TTS和ASR用于文本转语音以及语音识别转文本,当您需要使用文本转语音并播放给客户时,您需要购买TTS;当您需要使用智能语音导航或智能机器人功能时,您需要购买ASR。 购买类型请选择TTS&ASR。
(可选)不同租户对不同厂家的TTS有着不同的诉求,系统管理员可以建立多个不同的TTS服务器,详情请参见support文档《AICC****产品文档**》的“智能流程配置指南>系统管理员:管理租户和系统>管理服务器章节和管理TTS/ASR章节” 单击“查看引用”。
语音通知模板唯一标识。 语音通知模板为文本格式,平台将其转化为用户接听来电后的语音通知。可申请多个语音通知模板。 登录管理控制台,从“语音模板管理”页面获取。 添加语音通知模板,请参考添加语音模板。