检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音合成 支持“华北-北京四”、“华东-上海一”区域。 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
录音&收号&TTS相关问题 录音文件可以保存多久时间? 如何下载录音文件? 录音文件什么格式? 什么是收号? 如何实现收号功能? 如何查询放音收号结果? 语音通知中TTS的声音是什么类型的?是否支持自定义? 语音通知中TTS如何播报数字和英文符号? 播放完语音通知后是自动挂断电话吗?
开始合成响应 功能介绍 语音合成引擎收到实时语音合成请求时,首先向客户端发送合成开始响应,表示开始处理语音合成请求。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为START,表示开始语音合成。 trace_id String
仅供参考,具体请参考华为云官网价格详情,实际收费以账单为准。 表1 资源和成本规划(按需计费) 华为云服务 配置示例 每月预估花费 语音合成 TTS 按需计费:2元/千次(大于10千次/月) 区域:华北-北京四 计费模式:按需计费 购买量:1 接口调用次数费用 函数工作流 FunctionGraph
修订记录 表1 修订记录 发布日期 修订记录 2024-1-30 第一次正式发布。
快速卸载 进入上传文本的OBS和存放结果的OBS中,删除所有存放在里面的文件。 图1 删除文本上传的OBS中的文件 图2 删除存放结果的OBS中的文件 登录资源编排服务 RFS资源栈,找到该解决方案创建的资源栈,单击资源栈名称最右侧“删除”按钮,在弹出的“删除资源栈”提示框输入“
准备工作 创建rf_admin_trust委托(可选) 进入华为云官网,打开控制台管理界面,鼠标移动至个人帐号处,打开“统一身份认证”菜单。 图1 控制台管理界面 图2 统一身份认证菜单 进入“委托”菜单,搜索“rf_admin_trust”委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤。
开始使用 在华为云控制台打开对象存储服务 OBS,打开上传文本的OBS(本案例中为text-to-speech-in,实际OBS名称以部署指定参数为准)。 图1 打开上传文本的OBS 上传需要合成的文本文件(文件编码格式为utf-8,建议使用txt文件,文件名称只支持包含数字、英
语音合成后输出的音频格式是什么 语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。 语音合成(Text To Speech ,TTS服务)服务的音频格式则根据接口中audi
依据文本生成TTS语音接口 场景描述 智能助手平台提供接口给第三方接入方调用,实现文本生成TTS语音。 如果需要转换的文本内容较长时,则接口响应时间会对应的增加。 接口方法 POST 接口URI https://IP:PORT/oifde/rest/api/tts/texttovoice
续订或退订TTS&ASR 操作步骤 续订: 使用一个具备登录条件的华为云账号登录华为云。 选择“ > > 服务列表> 企业应用 > 云客服”。 选择“云客服 > 资源管理 > TTS&ASR。 在上方选择您的呼叫中心实例名,找到您需要续订或退订的TTS&ASR。 单击TTS&ASR后的“续费”。
语音合成结果响应 音频流数据 时间戳数据 父主题: 实时语音合成响应
rviceComb引擎信息。 表1 引擎详细信息说明 引擎信息名称 信息说明 引擎名称 创建ServiceComb引擎时输入的引擎名称,单击可复制。单击可以修改引擎名称,名称以字母开头,由字母、数字和-组成,且不能以-结尾,长度为3~24个字符。 引擎ID 引擎的ID,单击可复制。
复1表示参加,回复2表示不参加。 自定义语音文件内容:xx邀请您参加xx会议,回复1表示参加,回复2表示不参加。 父主题: 录音&收号&TTS相关问题
音频流数据 功能介绍 分多段返回二进制语音数据流,如果用户未设置语音格式,则默认返回pcm格式语音。 父主题: 语音合成结果响应
录音文件什么格式? 录音文件为A-Law、8000Hz采样、64kbs比特率、单声道的“.wav”格式的文件。 父主题: 录音&收号&TTS相关问题
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
SP可以要求业务平台播放多段语音,每段语音的内容都可以是下列两种语音中的一种: 语音文件中录制的语音。 文本(需要先通过模板定义)通过TTS服务转换成的语音。 业务体验描述: SP想要给用户A通知一段或多段语音。 SP向语音通话平台发送播放语音通知业务请求。 语音通话平台呼叫用户A的号码。
录音文件可以保存多久时间? 录音文件保存7天。如果对实时性要求不高,建议在次日凌晨集中下载录音文件,可以避免白天挤占企业自身的带宽资源。 父主题: 录音&收号&TTS相关问题
可选择不保存到本地。需具体到文件,如D:/test.wav /** * 用于语音合成参数设置,例如发声人、音高、语速、音量、采样率、连接超时。所有参数均可以不设置,采用默认。 * * @param request 语音合成请求 */ private void setPara