云服务器内容精选

  • 模特表现 拍摄过程中模特的手部动作、面部表情及各方面的状态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为保证数字人的训练效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15-30秒静默 + 4-5分钟演讲。 需要交互:15秒静默 + 无语义动作 + 4-5分钟演讲。 需要动作编排和交互:15秒静默 + 无语义动作 + 有语义动作 + 4-5分钟演讲。 详细录制说明,如下所示: 静默期:录制人物的初始静默状态,时长约15-20秒。 模特正视镜头,面带微笑,嘴巴闭合,保持静默。手部可根据习惯自然放于初始位置。 录制动作期:录制原子动作,时长约40秒(不需要智能交互功能可跳过此步)。 按照指导边讲边动作,整体动作保持自然,动作间隔期静默时身体可微微放松,自然眨眼。 自然表达期:录制自然说话时的嘴型、动作、状态、神情等,时长约4分30秒。 按照语料逐段演讲,保持自然语速和小幅度动作,头部可自然摆动。 停顿时必须完全闭合嘴唇,手部恢复至初始位置(建议拍摄前简单练习)。
  • 收音说明 MetaStuido会使用视频中的语音,并结合对应的真人口型变化,训练口型驱动效果,训练结果还会经过专家的技术审核。 所以在收音这方面,建议如下: 视频的音画必须同步。 环境需安静无噪声。模特人声需清晰,无其他人声干扰。尽量减少视频底噪。 建议选用小蜜蜂或其他专业麦克风搭配相机进行拍摄,会大幅降低视频底噪和其他环境噪声。但请注意:尽量隐藏麦克风不被拍摄到,否则生成的数字人形象会一直包含麦克风。
  • 常见问题 如果拍摄过程中有人闯入或出现突发声音,如雷声、汽车喇叭声等,要重新拍摄吗? 根据以往的录制经验,小于3秒的短暂闯入声音不会对最终训练效果产生明显影响。您只需保证类似的突发声音越少越好。 如果没有小蜜蜂或其他专业麦克风设备,可以使用相机内置的麦克风录制吗? 大部分相机内置麦克风的声音录制效果也能满足要求。MetaStuido对声音清晰度可以有适度妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被摄模特正在说话时。