数字内容生产线 METASTUDIO-算法备案公示:华为云MetaStudio分身数字人驱动算法

时间:2024-08-12 09:48:08

华为云MetaStudio分身数字人驱动算法

表1 分身数字人驱动算法

算法项

描述

算法名称

华为云MetaStudio分身数字人驱动算法

备案编号

网信算备520111252474601240045号

算法基本原理

分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。

其基本情况包括:

  • 输入数据:真人视频、音频。
  • 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。
  • 输出结果:数字人视频。
  • 应用领域:分身数字人驱动算法可以应用于真人视频自动生成,包括新闻播报,课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。

算法运行机制

  1. 选择一段真人视频。
  2. 输入真人视频,经过平台专家安全审核通过,且用户授权使用后,由训练人员选取真人视频中符合要求的视频进行预处理。预处理完成后,进行深度学习训练,生成该真人形象的数字人驱动模型。
  3. 推理阶段输入一段音频。
  4. 音频输入至数字人驱动模型后,经过模型推理生成数字人形象播报视频。
  5. 数字人视频通过审核后返回给用户。

算法应用场景

分身数字人驱动算法可以应用于真人视频自动生成,包括新闻播报、课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。

算法目的意图

可以使用授权过的真人视频,在预训练模型基础上,生成真人数字人驱动模型。该模型可基于音频生成口型匹配的数字人视频,实现真人视频自动生成,包括新闻播报、课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。

support.huaweicloud.com/productdesc-metastudio/metastudio_01_0019.html