数字内容生产线 METASTUDIO-创建声音制作任务:操作步骤

时间:2023-11-09 17:23:19

操作步骤

  1. 登录MetaStudio控制台。
  1. 单击“声音制作”卡片中的“开始创建”。

    进入声音制作页面。如图1所示。
    • 界面左侧是定制声音页面。
    • 界面右侧上方展示声音制作流程,下方展示声音制作过程的演示视频,帮助用户快速制作声音。
      图1 定制数字人形象

  2. 配置声音制作参数。

    界面操作详情,如表1所示。
    表1 界面操作说明

    区域

    说明

    请选择声音制作服务

    系统提供如下声音制作服务,请选择一种声音制作服务。

    • 基础版声音制作:仅需20条语料音频,约20分钟左右完成声音制作。
    • 进阶版声音制作:需要100条语料音频,约4小时左右完成声音制作。

    每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。

    其中,进阶版声音制作需要更多语料,训练时长更长,声音效果更佳。

    各声音制作服务,均支持如下操作:

    • 手机录制上传声音语料,或直接在线录音生成声音语料。
    • 支持原生试听和制作声音试听。

    定制声音名称

    输入声音名称。

    示例:欢快女声。

    请选择声音性别

    声音的性别,如下所示:

    • 男生
    • 女生

    选择语言

    声音的语言,包含如下选项:

    • 中文
    • 英文

    选择声音标签

    声音的标签,包含如下选项:

    • 电商
    • 新闻
    • 营销

    请制作声音

    制作声音的方式为:

    • 语料上传:界面提供录音指导,需要按照指导,基础版提供20条语料音频,进阶版提供100条语料音频。音频仅支持wav格式,生成的全量语料音频需要压缩为一个zip格式的压缩包后上传。
    • 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或者100条合格的语料音频即可。

    如果选择“语料上传”的方式,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。

    声音授权

    单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。

  3. 单击“提交制作”。

    弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。

  4. 如果用户确认无误,单击“确认提交”。

    声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。

    声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。
    图2 制作任务提交成功

  5. 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。

    当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。

support.huaweicloud.com/usermanual-metastudio/metastudio_05_0008.html