云服务器内容精选

华为云首页用户手册

定制声音

数字内容生产线 METASTUDIO-创建声音制作任务:操作步骤

操作步骤登录MetaStudio控制台。单击“声音制作”卡片中的“开始创建”。进入声音制作页面。如图1所示。界面左侧是定制声音页面。界面右侧上方展示声音制作流程，下方展示声音制作过程的演示视频，帮助用户快速制作声音。图1 定制数字人形象配置声音制作参数。界面操作详情，如表1所示。表1 界面操作说明区域说明请选择声音制作服务系统提供如下声音制作服务，请选择一种声音制作服务。基础版声音制作：仅需20条语料音频，约20分钟左右完成声音制作。进阶版声音制作：需要100条语料音频，约4小时左右完成声音制作。每种声音制作服务后面都会展示剩余次数，需要保证剩余次数充足。其中，进阶版声音制作需要更多语料，训练时长更长，声音效果更佳。各声音制作服务，均支持如下操作：手机录制上传声音语料，或直接在线录音生成声音语料。支持原生试听和制作声音试听。定制声音名称输入声音名称。示例：欢快女声。请选择声音性别声音的性别，如下所示：男生女生选择语言声音的语言，包含如下选项：中文英文选择声音标签声音的标签，包含如下选项：电商新闻营销请制作声音制作声音的方式为：语料上传：界面提供录音指导，需要按照指导，基础版提供20条语料音频，进阶版提供100条语料音频。音频仅支持wav格式，生成的全量语料音频需要压缩为一个zip格式的压缩包后上传。在线录音：需要用户在线录制，先单击“开始环境检测”。首次录制界面会弹出提示，需要允许使用您的麦克风。当界面显示“录制环境合格”时，单击下方的“开始录音”。界面会弹出提示，开始录音后，将不能更改前面设置的基础信息，单击“确定”。单击“开始录音”，启动录制。根据界面提示，录制20条或者100条合格的语料音频即可。如果选择“语料上传”的方式，声音标签仅作为标签，来区分声音使用场景；如果选择“在线录音”的方式，服务会根据声音标签，生成其对应格式的音频文件，界面不展示音频文件格式，用户可不关注。声音授权单击“授权书模板”，下载授权书模板后打印。用户手写相关信息后，重新生成签署后的pdf文件，或者拍摄成jpg或png格式的图片后上传。单击“提交制作”。弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量，本次将消耗1个资源。如果用户确认无误，单击“确认提交”。声音制作任务提交成功后，界面提示“制作任务提交成功”，如图2所示。声音制作任务提交成功后，需要等待1天左右的时间审核。任务审核通过后，启动声音制作。图2 制作任务提交成功用户可以单击“查看制作任务列表”，查看声音制作任务审核进展。当状态变更为“系统审核完成”，自动启动算法训练。如果系统存在多个算法训练任务，可能会存在排队和延迟的现象，请耐心等待。

数字内容生产线 METASTUDIO 定制声音