数字人常用概念
数字人
数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。
具备如下特点:
- 2D模型,通过拍摄真人视频训练生成
- 无表情&骨骼数据
- 只能由AI驱动
- 使用既定表情&动作
IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。
具备如下特点:
- 3D模型,通过艺术设计生成
- 有表情、骨骼数据
- 可由真人动作驱动
- 能呈现自定义表情&动作
剧本、画布和设置
视频制作、视频直播功能,都需要进行视频创作,下面以视频直播为例,进行说明。
- 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。
- 画面布局:简称“画布”,如图中2区域所示。主要为人物形象、背景、贴图、文本框、视频等内容大小、图层、位置的调整,这些都会在画布中设计和预览生成的效果。
- 开播设置:简称“设置”,如图中3区域所示,包括视频直播的各类设置。
- 剧本设计:简称“剧本”,视频制作、视频直播都需要经过剧本设计阶段,包含素材准备、画布设计、开播设置等操作,最终合成视频。
图1 直播间编辑界面
角色
数字人模型。
动作
数字人模型展示的动作。
捏脸
用户可根据自己的想法自由捏造风格化虚拟形象。
风格化素材
建模/捏脸时采用的五官、服饰、装饰等素材,比如发型、脸型、装饰、眉毛、鼻子等。
为什么选择华为云数字内容生产线
-
从模型训练到内容生成,端到端自助服务
支持批量生成数字人训练,任务管理可视化
从模型训练到内容生成,端到端自助服务
支持批量生成数字人训练,任务管理可视化
-
AI自矫正,口型精准匹配准确率95%+
母语一次训练多语言适配,语言泛化能力强
AI自矫正,口型精准匹配准确率95%+
母语一次训练多语言适配,语言泛化能力强
-
AI重打光,人脸与背景融合度高,图像更真实
走动/侧身/持物/实景等复杂场景建模,动作更自然
AI重打光,人脸与背景融合度高,图像更真实
走动/侧身/持物/实景等复杂场景建模,动作更自然
-
一卡多路并发训练、推理,高效率低成本
提供数字人的API/SDK调用接口,伙伴可集成至自有平台
一卡多路并发训练、推理,高效率低成本
提供数字人的API/SDK调用接口,伙伴可集成至自有平台
多场景覆盖,助力数字内容高效生产
数字人直播视频帮助
华为云MetaStudio数字人
数字人行业应用案例
华为云3D写实数字人能力展示