技术创新
盘古大模型 让人人实现数字人自由

当前,大模型无疑是国内外最为热门的话题,国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果,这不仅是对华为云盘古大模型的一大褒奖,更是对国内大模型产业领域的共同提振。

融合物理世界和数字世界

说到大模型,就不能不说到ChatGPT。其发布瞬间点燃了产业领域的大模型之火,其后大量的科技公司“火上浇油”, 纷纷发布了各自的大模型。

与其他公司不同,早在2021年4月,华为云盘古大模型就已经发布。在当年的世界人工智能大会上,华为云盘古超大规模预训练模型,就让观众们通过多种交互方式,深切感受到它在中文语言处理方面的强大能力。

作为国内首个全栈自主的AI大模型,华为云盘古大模型的目标很明确,它没有沉溺于吟诗作对之类的风花雪月当中,而是坚定地将重塑千行百业作为发展方向。

自从发布以来,华为云盘古大模型聚焦各类客户所关注的核心问题,致力于深耕行业,并为金融、政务、制造、矿山、气象、铁路等领域,打造了专属和定制的行业大模型与能力集。 

在华为开发者大会2023(Cloud)上,华为云盘古大模型迎来了又一次重大升级。在最新的3.0版本中,华为云盘古大模型不仅得到了能力的全方位提升,也首次在字面上明确了定位,即“为行业而生”。

作为一个面向行业的大模型,华为云盘古大模型3.0包括5+N+X三层架构,提供了满足行业场景的多种技能,专注于具体的应用场景和特定业务,为客户提供开箱即用的模型服务。

华为云盘古大模型的快速演进和迭代,得益于华为云AI的雄厚积淀。目前,华为云AI在各个行业已经拥有上千个深度合作项目,这种来自一线的真实打拼和行业Know-How,为华为云盘古大模型的成长提供了充足的“养分”。

华为云盘古大模型在能力方面的不断提升,也为华为云的产品服务带来全面加持,华为云MetaStudio就是其中的一例。通过打造云上的数字内容生产线,以及构建以人为中心的全场景智慧化体验,华为云MetaStudio加速了物理世界和数字世界的融合。

让每个人实现数字人自由

通过盘古基础大模型,华为云赋能MetaStudio数字内容生产线,打造了盘古数字人大模型,提供模型生成和模型驱动两大服务,让每个人都能实现数字人自由。

数字人(Digital Human/Meta Human),是运用数字技术创造出来的、与人类形象接近的数字化人物形象。起初,限于技术、成本等问题,数字人主要被用于垂直、专业的极少数领域之中。

得益于数字技术的快速进展,近几年数字人的应用范围不断扩大,开始被虚拟现实、教育、健康管理、智能客服等领域广泛采用,产业化不断加速,商业模式开始持续演变和多样化。

即便如此,对于很多机构和企业来说,数字人的制作与使用仍有着较高的门槛。如果只是玩票,以上的门槛之说可能并不成立,不过假如真的要数字人深入到生产、经营和服务等领域,企业仍然面临极高的难度。

按照华为云媒体服务产品部部长吕阳明的说法,MetaStudio数字内容生产线就是“让每个人实现数字人自由”,其中包含的建模、驱动、仿真、渲染等一系列流程,实现了低成本、低门槛、高效率、高拟真的数字人生产。

需要指出的是,华为云MetaStudio的数字人生产,并不只是面向To B或是高精专领域,甚至可以包括个人应用。打开脑洞设想一下,由于工作、学习等缘故,儿孙们往往无法常伴老人,这时候假如有一个儿孙形象的数字人时时陪伴,对于老人岂不是莫大的抚慰?

基于盘古大模型,华为云MetaStudio为新的数字人赋予了非常聪明的大脑。通过持续不断的训练,数字人可以真正实现拟人化和个性化的对话,其能力也会得到同步的提升。

与此同时,由于端侧的显示技术逐渐增强,数字人的形象也越来越饱满,越来越生动。在云侧完成的数字人驱动、数字人形象的渲染,也会通过网络推送到端侧,实现高质量、高画质和高质感的呈现。

数字未来成为现实

华为云在数字内容方面的积累由来已久,不过早期主要还是围绕视频、图片等内容生产。在发展的过程中,华为云注意到,一些深刻的变化正在发生,相关产业的游戏规则也开始改弦易辙。

以影视业为例,我们现在可以看到的实拍内容已经不多了,呈现于眼前的大多是计算机制作。比如说《流浪地球2》、《阿凡达2》等大片,你甚至很难在其中分辨出实景拍摄的片段。

基于这些趋势,华为云推出MetaStudio数字内容生产线,在云上通过自动化和AI技术,面向那些做数字内容生产的行业,实现自动化数字内容的生产制作。

现在看来,数字内容的生产实际上适用于所有行业。在我们奔向元宇宙的今天,对于千行百业而言,数字内容已经成为最基础的能力之一,缺乏数字内容的企业,其灵魂也是不完整的。

在华为开发者大会2023(Cloud)的开幕式上,当干练靓丽的数字人徐徐向我们走来,说出“每一个开发者都了不起”,那一刻,那种发自内心的感受很难仅仅用“惊艳”二字来形容……

确实惊艳,但是绝不止于此。此前,我们并非没有见过数字人,但是很多时候它们往往是静止或站立的,而且表情和手势过于生硬,也就很难在情感上引起我们的真实共鸣。

华为云MetaStudio数字内容生产线的做法可谓别出机杼,数字人驱动服务根据人脸部的136个特征点、10多个声音特征点等关键特征点,生成了逼真的形象。

接下来,在云上传输数据时,华为云MetaStudio只传输特征点数据,而不是原始的音视频数据,因此带宽需求就降低了1000倍以上,即便是在上行50K的弱网环境下,也可以实现4K 60fps的数字人会议体验,让传统的交流从“0101的比特传输”,走向“有温度的模型交互”。

当前,华为云MetaStudio在国内已经实现了广泛的合作与落地。在长沙马栏山、北京石景山VR/AR基地,华为云MetaStudio已经进入到综艺节目、影视音乐制作等领域;在深圳龙岗、浙江温州等地,华为云MetaStudio也进入到工业设计、服装设计等领域……

一同开启创意的小宇宙吧!很快你就会发现,华为云MetaStudio让那些我们曾经构想的瑰丽数字未来,正在逐渐变为现实。