数字内容生产线 METASTUDIO-创建声音制作任务:操作步骤
操作步骤
- 登录MetaStudio控制台。
- 单击“声音制作”卡片中的“开始创建”。
进入声音制作页面。如图1所示。
- 界面左侧是定制声音页面。
- 界面右侧上方展示声音制作流程,下方展示声音制作过程的演示视频,帮助用户快速制作声音。
- 配置声音制作参数。
界面操作详情,如表1所示。
表1 界面操作说明 区域
说明
请选择声音制作服务
系统提供如下声音制作服务,请选择一种声音制作服务。
- 基础版声音制作:仅需20条语料音频,约20分钟左右完成声音制作。
- 进阶版声音制作:需要100条语料音频,约4小时左右完成声音制作。
每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。
其中,进阶版声音制作需要更多语料,训练时长更长,声音效果更佳。
各声音制作服务,均支持如下操作:
- 手机录制上传声音语料,或直接在线录音生成声音语料。
- 支持原生试听和制作声音试听。
定制声音名称
输入声音名称。
示例:欢快女声。
请选择声音性别
声音的性别,如下所示:
- 男生
- 女生
选择语言
声音的语言,包含如下选项:
- 中文
- 英文
选择声音标签
声音的标签,包含如下选项:
- 电商
- 新闻
- 营销
请制作声音
制作声音的方式为:
- 语料上传:界面提供录音指导,需要按照指导,基础版提供20条语料音频,进阶版提供100条语料音频。音频仅支持wav格式,生成的全量语料音频需要压缩为一个zip格式的压缩包后上传。
- 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或者100条合格的语料音频即可。
如果选择“语料上传”的方式,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。
声音授权
单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。
- 单击“提交制作”。
弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
- 如果用户确认无误,单击“确认提交”。
声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。
- 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。
当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。