云服务器内容精选

  • 操作步骤 登录MetaStudio控制台。 单击“声音制作”卡片中的“开始创建”。 进入声音制作页面。如图1所示。 界面左侧是定制声音页面。 界面右侧上方展示声音制作流程,下方展示声音制作过程的演示视频,帮助用户快速制作声音。 图1 定制数字人形象 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 系统提供如下声音制作服务,请选择一种声音制作服务。 基础版声音制作:仅需20条语料音频,约20分钟左右完成声音制作。 进阶版声音制作:需要100条语料音频,约4小时左右完成声音制作。 每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。 其中,进阶版声音制作需要更多语料,训练时长更长,声音效果更佳。 各声音制作服务,均支持如下操作: 手机录制上传声音语料,或直接在线录音生成声音语料。 支持原生试听和制作声音试听。 定制声音名称 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示: 男生 女生 选择语言 声音的语言,包含如下选项: 中文 英文 选择声音标签 声音的标签,包含如下选项: 电商 新闻 营销 请制作声音 制作声音的方式为: 语料上传:界面提供录音指导,需要按照指导,基础版提供20条语料音频,进阶版提供100条语料音频。音频仅支持wav格式,生成的全量语料音频需要压缩为一个zip格式的压缩包后上传。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或者100条合格的语料音频即可。 如果选择“语料上传”的方式,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。