定制声音

MetaStudio支持自定义生成声音

操作前准备

用户创建声音制作任务前,需要参考操作步骤准备如下内容:

参考真人声音录制(基础版&进阶版),提前录制20条语料的长音频WAV文件,每句之间需要有2~3秒的停顿。

语料请使用直播带货风格文案(20句)。

声音授权签署文件。

操作步骤

登录MetaStudio控制台。

单击“声音制作”下方的“开始创建”,进入声音制作页面。如图1所示。

图1 定制数字人形象




配置声音制作参数

配置声音制作参数

区域

说明

请选择声音制作服务

选择声音制作服务“基础版声音制作”

定制声音名称

输入声音名称,示例:欢快女声

请选择声音性别

选择声音的性别,示例:女生

选择语言

选择声音的语言,示例:中文

选择声音标签

声音的标签,请选择“电商”

请制作声音

使用“语料上传”的方式,直接上传已录制好的20条电商文案长音频WAV文件

声音授权

单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传

第三方用户ID(可选)

无需填写

说明

请选择声音制作服务

选择声音制作服务“基础版声音制作”

定制声音名称

输入声音名称,示例:欢快女声

请选择声音性别

选择声音的性别,示例:女生

选择语言

选择声音的语言,示例:中文

选择声音标签

声音的标签,请选择“电商”

请制作声音

使用“语料上传”的方式,直接上传已录制好的20条电商文案长音频WAV文件

声音授权

单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传

第三方用户ID(可选)

无需填写

  1. 单击“提交制作”。
  2. 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。

  3. 如果用户确认无误,单击“确认提交”。
  4. 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。
  5. 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。
  6. 图2 制作任务提交成功

  7. 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。
  8. 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。

  9. 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
  10. 选择“声音”,找到已生成的声音,单击试听声音效果。