数字人功能特性

MetaStudio提供形象制作、声音定制、分身形象视频制作、分身形象视频直播、分身形象名片制作、智能交互等能力,如表1所示。

表1 功能特性

功能名称
功能描述

形象制作

通过拍摄真人视频,建模生成数字人分身形象。

数字人可作为虚拟主播、虚拟主持、虚拟客服、虚拟老师等形象使用。

声音制作

通过录制真人声音,建模生成自定义的数字人声音,用于为数字人配音。

也支持直接购买第三方声音套餐,使用套餐内的声音,为数字人配音。

视频制作

使用数字人形象,进行画布和音频设置,合成视频。

适用于各类培训、宣讲、知识分享等场景。

视频直播

使用数字人形象,进行画布设置、剧本设计、互动和开播设置,生成直播视频。

可用于在合作的第三方平台进行数字人视频直播。

智能交互

支持用户开箱即用的智能交互数字人场景;也支持使用智能交互API或SDK,自主开发实现与数字人对话场景。

数字人名片

支持为分身数字人制作形象名片,且支持通过名片来试听语音效果。

照片数字人

支持上传正面清晰的人像照片,生成会说话的照片数字人视频。

产品优势

控制台自助服务,一站式快速生成所需内容

用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。

华为云盘古数字人大模型,赋能千行百业数字化营销新模式

MetaStudio服务依托华为云基础设施、海量算力(CPU/GPU/NPU)、全球一张网(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。

数字人升级迭代快,提升产品竞争力

- 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。

- 表情自然:通过AI眼神矫正,矫正前后眼部ID一致,避免眼神不聚焦。

- 图像真实:智能重打光,背景融合更真实。

- 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。

- 多语言泛化:一次母语训练,多语种支持;支持20+语种,覆盖主流语言。

相对真人成本下降90%以上

- 一次拍摄与训练后,可无限次使用;无时间约束、无时长限制、无容量限制;统一质量,稳定性高;口型、动作匹配度高,无限接近真实。

- 仅分身数字人动作自由度受限于采集视频的动作范围,综合对比数字人比真人成本低、效率高,且质量稳定。

数字人直播更真实、更沉浸

- 支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。

- 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。

实时智能交互,提升客户满意度和品牌形象

开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。

- 1.5秒超低时延交互

实时驱动极低延时,保障用户真实体验。

- 多模型数字人大脑

华为云智能问答机器人CBS

华为云盘古大模型

- 能力开放可集成

智能交互端侧Web SDK

形象驱动API

数字人大脑API

数字人能力开放,多种合作模式灵活选择

- 实名安全认证后,可使用控制台在线自助完成内容制作。

- 集成数字人API、SDK至企业自建平台。

- 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。

帮助客户提升产品竞争力

- 大幅提升数字人生产效率

满足批量生成数字人诉求,平台支持几百到上千的并发模型训练任务。

- 大幅提升数字人生产质量

模型质量提升30%以上,数字人名片迅速引流新阵地直播产品,业务推广无后顾之忧。

- 解决产品端到端服务能力

可接入其他AIGC产品,打造AIGC数字人视频生成到剪辑端到端的解决方案能力。

多行业多场景广泛应用

MetaStudio数字人已广泛应用于企业代言、综艺主持、电商带货、新闻播报、培训讲师、文旅导览、营业厅客服、市场营销等场景。

安全稳定可靠

中国站、国际站(新加坡)、欧洲站(爱尔兰)公有云均已部署,支撑客户全球业务拓展。

更专业的数字内容生产工具,创作得心应手

形象制作

产品介绍

  • 仅需录制一段真人说话的视频,即可复制本人说话习惯,训练出媲美真人的分身数字人

关键能力

线上流水线制作,交付效率≤3个工作日

资产加密存储,人证匹配保证更安全

口型表现更精准,准确率>95%

支持走动/侧身/持物/实景训练,动作随机编排更智能

AI眼神矫正,提供持续眼神交流,细节更丰富

建议搭配使用
声音制作

产品介绍

  • 支持中英文声音模型制作,获得类真人音色,满足不同类型客户要求

关键能力

基础版:支持手机录制20条语料音频,快速获得类真人音色

进阶版:支持手机录制100条语料,3天制作,获得高还原度音色

高级版:录音棚专业录制的1小时语料,5天制作,获得现场级高品质音色

视频制作

产品介绍

  • 一站式视频制作平台,帮助企业轻松实现降本增效,解放团队生产力

关键能力

支持最高4K分辨率导出

支持文本、音频驱动,1080p视频合成效率1:1.5

支持自动解析ppt素材

支持导入图片、视频、音频等素材,海量预制模板

支持敏感词检测

灵活的接入方式

视频直播

产品介绍

  • 超逼真的“真人”主播,一台电脑即可随时开启7*24小时不间断直播

关键功能

一站式纯云端渲染,高清画面实时推流

弹幕自动回复、实时插播干预、真人语音接管等多种模式

模板个性化配置,支持跨账号分享

灵活的接入方式

经验丰富的数字人直播运营伙伴,赋能小白用户快速开播

数字人智能交互

产品介绍

  • 用户自定义问答知识库,快速配置可视化的数字客服交互问答体验

关键能力

1.5s超低交互时延

开放性接入不同大模型

灵活的接入方式

ai数字人常见问题

ai数字人常见问题

  • MetaStudio支持哪些区域?

    MetaStudio服务已商用,商用环境为“华北-北京四”。“华东-上海一”目前仍为测试环境,如需使用,请提交工单处理。

  • MetaStudio有哪些计费项?

    MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。

    1. 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。
    2. 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。
    3. 资产管理费用:即服务资产管理的费用。
    4. MetaStudio的计费详情,请参考计费说明
  • 视频合成失败如何处理?

    视频合成失败时,请您根据界面提示信息进行问题定位及修改。

    1. 提示“视频名称包含非法字符”
    2. 请您根据要求修改导出文件名称中的敏感字符。
    3. 提示“资产名称重复”
    4. 请您根据要求重新修改导出文件的名称。
    5. 视频任务合成状态一直显示“待合成”
    6. 可能是由于当前视频任务正在等待队列中,请您耐心等待。
  • 提示模板不可用怎么办?

    请根据实际情况判断处理:

    1. 如果是自己创建的模板不可用,请检查模板中的资产是否正常,即资产处于激活状态时正常,如果资产取消激活或已删除会导致模板不可用。
    2. 如果是分享给我的模板不可用,可能是分享者取消了模板分享,或者模板中的资产状态不正常,即资产已取消激活或被删除。
  • 如何调用MetaStudio接口?

    MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。

  • 风格化照片建模的照片有什么要求?

    用于风格化照片建模的照片需要符合以下要求:

    1. 照片内容要求:正面照,脸部无遮挡。
    2. 照片格式要求:jpg/jpeg/png格式照片,最大分辨率为3840*2160。

数字人视频帮助

华为云MetaStudio数字人

02:26

华为云MetaStudio数字人

数字人行业应用案例

01:17

数字人行业应用案例

华为云3D写实数字人能力展示

01:32

华为云3D写实数字人能力展示

如何访问MetaStudio服务

00:26

如何访问MetaStudio服务

如何搭建直播间

00:46

如何搭建直播间

视频制作全流程展示

02:27

视频制作全流程展示