数字内容生产线 METASTUDIO-算法备案公示:华为云MetaStudio数字人视觉驱动算法

时间：2025-02-19 17:40:17

华为云MetaStudio数字人视觉驱动算法

表4 视觉驱动算法
算法项	描述
算法名称	华为云MetaStudio数字人视觉驱动算法
备案编号	网信算备520111252474601240053号
算法基本原理	数字人视觉驱动算法是指使用神经网络，将视频中的人脸表情和人体姿态，转换为表情基系数及数字人骨骼驱动数据的一种技术。其基本情况包括：输入数据：单人表演视频。算法原理：通过深度学习算法识别人脸表情和人体姿态，转换为表情基系数及数字人骨骼驱动数据。输出结果：表情基系数、数字人骨骼驱动数据。应用领域：应用于影视制作、虚拟人姿态控制等场景，加速影视制作的动画生成效率，提升虚拟人控制体验。
算法运行机制	输入为单人表演视频。通过视频抽帧得到单张图片。经过安全过滤，判断是否通过安全筛选，若不通过则不进行数据生成和结果返回操作。将视频图片输入至算法模型中，将视频图像分割为面部、手部和身体三个区域。使用深度学习算法，识别面部区域转化为面部表情，识别手部区域转化为手部骨骼驱动数据，识别身体转化为人体骨骼驱动数据。对算法输出系数进行平滑处理及异常数据过滤，返回结果。
算法应用场景	数字人视觉驱动算法可用于影视制作、虚拟人姿态控制等场景，加速影视制作的动画生成效率，提升虚拟人控制体验。
算法目的意图	视频驱动数字人动作，实现影视制作动画快速生成。虚拟现实Avatar形象姿态控制。其他需要通过表演者驱动数字人动作表情的领域，以提升形象动画生产效率。