视界
看过HDC 2024,真是感觉B端大模型思路不一样

2024年的大模型赛事已过半程。

看过科技企业前半程的表现,尤其是压轴上场的华为开发者大会2024(HDC 2024),越发确认C端大模型和B端大模型的思路真是不一样。C端大模型在“卷Token长度”、“卷价格”,其背后潜在目的是为了“卷数据”。他们希望以Token长度和价格,卷来更多的数据,加速提升大模型的成熟度,进而增加生态黏性。

B端大模型的思路完全不一样。

HDC 2024期间,华为云盘古大模型5.0正式发布。发布过程中,华为云用了一半时间讲创新技术,另一半时间讲大模型的行业落地。而且华为云从下到上所有细节都没一笔带过,从AI基础设施,到多模态大模型,再到行业大模型,以及具身智能,每一个环节的想法,华为云也都交代得清清楚楚。

华为云发布盘古大模型5.0

大模型到底在卷啥?

其实,在“百模大战”最热闹的时候,也少有人提出“大模型泡沫”的质疑。或者说,在这场关乎未来生产力的全球竞争中,现在多少卷些也无所谓。只不过进入2024年,大模型的竞争焦点开始分化。

“百模大战”早期,科技企业是在卷参数量,千亿参数和万亿参数大模型层出不穷。随后,部分大模型又开始“卷Token长度”、“卷Token价格”,但这些都是典型C端大模型的思维。

B端大模型当然也缺数据,尤其是缺高质量的中文数据。好在,中国并不缺应用场景。两会期间提出“人工智能+”行动计划,并号召央企带头抢抓人工智能赋能传统产业,率先将应用场景开放出来。

这就释放了相当积极的信号。

只不过,挑战依然存在。企业中的文本、音频、图片、视频等数据,散落在不同角落;企业中的数据还要经专家级的标注,才能成为高质量的训练语料;企业用户对大模型的识别准确度,更提出了更高的入职标准。

或者说:“工作向左,生活向右”。从文理分班的那一刻起,企业用户对B端大模型的能力结构,就提出了不一样的需求。

 

不挑食,才能理解物理世界

华为云在此真下了不少功夫。

去年的这个时候,华为云盘古大模型3.0发布,它包括5+N+X三层架构,是一个完全面向行业的大模型系列;今年HDC 2024期间,华为云盘古大模型5.0正式发布,它在多模态、全系列、强思维等方面进行了全新升级。

其中,“多模态”能力尤其受到关注。原因很简单,物理世界就是多种模态的,大模型要走进千行万业,大模型要看懂物理世界中的应用场景,就需要更多地理解及整合多模态的行业数据。

此方面的华为云盘古大模型5.0,主打的就是一个不挑食,营养均衡。它能够更好地理解物理世界,更精准地识别和理解文本、图片、视频等数据,甚至是雷达、红外、遥感等更多的模态数据。

上述能力应用在图片和视频识别方面,盘古大模型5.0就能够准确分析出卫星遥感图像中的农作物生长情况,这可用于产量预估、病虫害监测等领域;它还能够通过红外影像,精准的识别夜间车辆的位置,这也将提升交通违停的管理效率。

同时,盘古大模型5.0的多模态生成能力,跟Sora关注点也不一样。它聚焦于行业急需的应用场景。例如,在自动驾驶领域,它就通过创新的STCG技术,大规模地生成和实际场景相一致的驾驶视频数据。甚至,它还可以用模型生成晴天、雨天、黑夜的行车视频。

 

B端大模型的“着陆点”

另一维度,关注“多模态”数据之外,B端大模型也更关注“落地点”。2023年,科技企业都在研究“大材小用”——将大模型落地于小场景。但之后他们发现,“小材小用”或“量才适用”才是更好的思路。

本次HDC 2024,华为云盘古大模型5.0就推出了不同参数规格的模型,以适配不同的业务场景,例如,十亿级参数的Pangu E系列,可支撑手机、PC等端侧的智能应用,属于典型的“小钢炮”式大模型。

百亿级参数的Pangu P系列,则适用于低时延、高效率的推理场景;千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。

毫无疑问,上述四个系列的大模型,都是典型B端大模型的思维。它们可落地在智能终端、智慧工厂、企业大脑、城市IOC等场景,也可以担任办公助理、质检员、网格管理员等职业角色。

 

B端大模型的制高点

当然,B端大模型的制高点在行业大模型,制高点上的明珠更是企业大模型。这也正如华为常务董事、华为云CEO张平安所说:“华为云盘古大模型是为解决行业难题而生。”

过去的一年,华为云盘古大模型已在30多个行业、400多个场景中落地,已在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥着巨大价值。

例如从去年关注货运的铁路大模型,到今年推出关注客运的高铁大模型,就说明盘古大模型的能力又有精进。其中搭载了“盘古眼”的巡检机器人,可精准识别一列动车的3.2万个项点,覆盖8大类、350+种复杂故障,故障识别准确率可达99%。

另一需要关注的是钢铁大模型。

宝钢股份正在推动盘古大模型在热轧、高炉等场景落地。实践表明,在大模型的调节下,每减少10℃的温度波动,每吨铁水就可以减少1kg焦炭消耗,成本降低3块钱。如此一来,预计每年可以为宝钢股份降本超过10亿元。

 

B端大模型知行合一

除此之外,B端大模型的另一思维特点是讲究“知行合一”。复杂逻辑推理是大模型成为行业助手的关键,华为云则将思维链技术与策略搜索深度结合,极大提升了数学能力、复杂任务规划能力,以及工具调用能力。

很明显,华为云已经在关注AI应用的更高阶段。过去三年,AI应用多停留在感知智能、互动智能、理解智能阶段,典型的应用包括人脸识别、智能客服、智能营销、办公助手、营销助手等。

此次,华为云升级大模型的多模态能力,以及强思维、复杂逻辑推理能力,其实已经是瞄准了AI Agent智能体和具身智能,这是AI应用的更高阶段。或可如此比喻,如果大模型是“大脑”,智能体就是“手脚”,具身智能则代表AI应用的“知行合一”。

HDC 2024期间,华为云就展示了诸多具身智能应用。盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。

更重要的是,华为云还有杀手锏。HDC 2024期间,华为正式发布HarmonyOS NEXT版,“盘古”和“鸿蒙”也首次联袂亮相。而且不同于ChatGPT与苹果iOS的集成,“盘古”与“鸿蒙”之间,智能时代的操作系统与万物智联的操作系统之间,实现了深度集成。

这其中典型的应用,就包括云助小艺,以及云手机等。而且类似的应用,已更多地出现在行业端。据华为云合作伙伴介绍:如此的深度集成,系统调用AI能力将更为流畅,用户的数据安全也将得到保障,这都是企业用户关注的核心。

 

AI全栈能力创新

B端大模型的最后一个典型思维是,关注从AI基础设施、AI算力,到AI开发平台、AI大模型的全栈服务。

HDC 2024期间,华为云透露了一组数据:

业界万亿参数模型训练无中断时长是2.8天,华为云昇腾AI云服务可以做到40天无中断;业界集群故障恢复的平均时间约60分钟,昇腾AI云服务可以缩短到10分钟。同时,昇腾AI云服务还能将大模型的资源开通时间从月级缩短到天级。

不仅如此。当前云平台在大模型的训练和使用过程中,一直存在“算力墙”、“内存墙”、“能效墙”等问题。对此,华为云CTO张宇昕说:“为了解决这个难题,打造了下一代的云基础设施CloudMatrix,改变了传统数据中心的架构和算力供给模式。”

这一基础设施,将传统的以CPU为中心的主从架构,演进为多元算力对等全互联架构;并通过高速互联网络协议,将CPU、NPU、GPU等算力资源全部互联和池化,从而把AI算力从单体算力演进到矩阵算力,开启智能算力新纪元。

同时,针对云平台在大模型的训练和使用中存在的“内存墙”问题,华为云首创EMS弹性内存存储,基于Memory Pooling专利技术,通过显存扩展、算力卸载、以存代算等三大手段来打破内存墙。

 

解行业难题、做行业难事

由此可见,华为云就代表了典型B端大模型的思维。此思维是“不挑食”,努力理解物理世界;是关注垂类模型,寻找更多业务“着陆点”;是抢占行业大模型的业务“制高点”;也是讲究“执行合一”;更是关注从AI基础设施、AI算力,到AI开发平台、AI大模型的全栈技术创新。

正是在五个方面持续投入,华为云才能年年在开发者大会上拿出新东西,给开发者、企业使用;遵循此五个方面的业务路线和技术路线,华为云也才敢说:“盘古将继续坚定在行业里解难题、做难事。”