检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
1.训练phone级别的语言模型 chain模型类似于基于最大互信息的区分性训练,也需要分子和分母有限状态机。在分母有限状态机方面,区别于传统最大互信息的区分性训练,chain模型用训练数据的强制对齐结果,训练了一个四元语法音素单元的语言模型,并将其转成有限状态机。
时间戳数据 功能介绍 实时语音合成服务在生成音频流的同时,可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。 参数设置 设置请求参数subtitle为"word_level"或"phoneme_level"时,开启时间戳功能。
父主题: 实时语音识别响应
Wav2Lip模型的输入为任意的一段视频和一段语音,输出为一段唇音同步的视频。 Wav2Lip的网络模型总体上分成三块:生成器、判别器和一个预训练好的唇音同步判别模型Pre-trained Lip-sync Expert。
语音回呼呼叫状态通知API 接口功能 语音通话平台通过此接口向客户推送语音通话业务用户呼叫时的状态信息,如呼入、呼出、振铃、应答、挂机等状态的信息。
删除训练作业版本 功能介绍 删除训练作业一个版本。 此接口为异步接口,作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。
语音合成接口 语音合成 SSML标记语言介绍
KPI异常检测:https://res.hc-cdn.com/TrainService-CF-Product/1.0.28/hws/online-doc/template-notes/KPI.html KPI时序预测:https://res.hc-cdn.com/TrainService-CF-Product
放音文件和语音模板必须要审核通过后才可使用吗? 是的。 放音文件需按要求制作,请参考制作放音文件。并通过放音文件管理页面提前上传到语音通话平台并通过审核后才可使用。 语音模板需通过语音模板管理页面提前上传到语音通话平台并通过审核后才可使用。 父主题: 放音文件及语音模板配置
vad_tail 否 Integer 音频的结尾中的静音时间,正常情况下不应设成很小的值。
更新训练作业描述 功能介绍 更新训练作业的描述。 URI PUT /v1/{project_id}/training-jobs/{job_id} 参数说明如表1所示。 表1 参数说明 参数 是否必选 参数类型 说明 project_id 是 String 用户项目ID。
父主题: 实时语音识别响应
实时语音合成请求 开始语音合成请求 父主题: 实时语音合成接口
语音回呼呼叫状态通知API 语音通话平台向SP推送接收语音通话业务用户呼叫时的状态信息,如呼入、呼出、振铃、应答、挂机等状态的信息。 语音回呼话单通知API 通话结束后,语音通话平台向SP推送通话的话单信息。 获取录音文件下载地址API 获取通话后的录音文件下载地址。
train_instance_type:必选参数,训练实例类型,这里指定'local'即为在notebook中进行训练。 train_instance_count:必选参数,训练使用的worker个数,单机训练时为1,训练作业只在当前使用的notebook中运行。
查询训练作业标签 获取训练作业事件列表 创建训练作业镜像保存任务 查询训练作业镜像保存任务 获取训练作业支持的公共规格 获取训练作业支持的AI预置框架
表1 必须修改的训练超参配置 参数 示例值 参数说明 ORIGINAL_TRAIN_DATA_PATH /home/ma-user/work/training_data/train-00000-of-00001-a09b74b3ef9c3b56.parquet 必须修改。
训练 上传数据至OBS并预热到SFS Turbo中 创建训练任务 父主题: 实施步骤
语音模板中的变量是如何填充的? 在语音通话控制台添加语音模板,并在调用语音通知API时携带模板ID(templateId)和变量值列表(templateParas),系统会自动将模板内容通过TTS服务转换成语音,向用户播放。 父主题: 放音文件及语音模板配置
放音文件及语音模板配置 放音文件和语音模板必须要审核通过后才可使用吗? 语音通话有哪些可自定义的呼叫提示音,如何上传审核? 语音通话的放音文件是固定的还是要用户上传呢? 语音通知中使用放音文件和语音模板有什么区别? 放音文件的音频格式要求是什么?