数字内容生产线 METASTUDIO-算法备案公示:华为云MetaStudio数字人视觉驱动算法

时间:2024-08-12 09:48:08

华为云MetaStudio数字人视觉驱动算法

表4 视觉驱动算法

算法项

描述

算法名称

华为云MetaStudio数字人视觉驱动算法

备案编号

网信算备520111252474601240053号

算法基本原理

数字人视觉驱动算法是指使用神经网络,将视频中的人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据的一种技术。

其基本情况包括:

  • 输入数据:单人表演视频。
  • 算法原理:通过深度学习算法识别人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据。
  • 输出结果:表情基系数、数字人骨骼驱动数据。
  • 应用领域:应用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。

算法运行机制

  1. 输入为单人表演视频。
  2. 通过视频抽帧得到单张图片。经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。
  3. 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。
  4. 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。
  5. 对算法输出系数进行平滑处理及异常数据过滤,返回结果。

算法应用场景

数字人视觉驱动算法可用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。

算法目的意图

  • 视频驱动数字人动作,实现影视制作动画快速生成。
  • 虚拟现实Avatar形象姿态控制。
  • 其他需要通过表演者驱动数字人动作表情的领域,以提升形象动画生产效率。
support.huaweicloud.com/productdesc-metastudio/metastudio_01_0019.html