“道生一,一生二,二生三,三生万物”,老子在《道德经》中将道视为孕育万物的根本。同理,科技树的发展也离不开最底层的根技术。当前,AI处在加速行业落地的关键阶段,但仍然面临很多挑战,比如:各行业的AI应用门槛依然不低,AI与行业知识的结合有待提升,开发者开发、训练和部署模型的效率不高等。
在推动AI落地方面,华为云的战略布局非常清晰——基于“一切皆服务”战略,聚焦三大根技术。如果把华为云的AI布局比作一棵大树,预训练大模型、知识计算、AI求解器这三大根技术就是深埋在沃土中的根系。
在第三届华为云AI院长峰会上,华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇分享了华为云AI布局的最新进展,并介绍全新的华为云盘古图网络大模型。从这些根技术的迭代,可以一窥华为云AI的发展脉络。
向下扎根:从L0到L2,完成从学术大模型到产业大模型的转变
目前,预训练大模型已经成为AI产业界的热点。通过一次预训练+下游任务微调的方式,大模型让AI模型开发实现了从“作坊式”向“工业化”的升级。近两年,国内外科技巨头纷纷加入“练大模型”的队伍,各家大模型的参数体量从千亿到万亿甚至更高。
“比拼模型体量的‘大跃进’不可取。”田奇认为,大模型应该直面产业落地的挑战,完成从学术大模型到产业大模型的转变。
华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士 田奇
回顾华为云盘古大模型的发展历程,从2020年启动研发,2021年4月正式发布,到2022年聚焦行业应用落地,这一过程中,华为云盘古大模型自身不断迭代,其进化路径可以分为L0-L1-L2三大阶段。L0-L2不是替代关系,而是并存,上层在下层的基础上演化而来。这也让盘古大模型一步步从实验室走向千行百业,走向更细分的实际场景。
L0是指基础大模型。目前,华为云已推出五大水平领域的基础大模型,分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和最新推出的Graph(图网络)大模型。
其中,NLP(中文语言)大模型是NLP领域首个千亿参数的中文大模型,它具备强大的文本理解和生成能力,可以理解文字背后的含义,从文本中抽取关键信息。
CV(视觉)大模型首次兼顾了图像判别与生成能力,在ImageNet 1%、10%数据集上的小样本分类精度上,达到了业界最高水平,能够对各行业的图像进行识别和检测,可广泛应用在工业质检、物流管理等领域。
科学计算大模型主要解决各种科学问题,如气象预报、海浪预测、分子动力学预测、微分方程求解等,旨在用AI促进基础科学的发展。
多模态大模型具备图像和文本的跨模态理解、检索与生成能力,通过跨模态语义关联实现视觉-文本-语音多模态统一表示,采用一个大模型即可灵活支撑图-文-音全场景AI应用,可用于产品设计、艺术创作、语音播报、海报创作等领域。
Graph(图网络)大模型首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用,比如预测企业财务风险、制造企业优化工艺等等。
L1是指行业大模型。若想发挥盘古大模型的能力和优势,还需要让盘古大模型与行业相结合,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。
比如,药物分子大模型可以辅助科研人员加速药物研发过程,将严谨复杂的分子化合物生成过程可视化以及智能化,高效的进行筛查“老药”加以新用以及“新药”研发。通过预先训练学习17亿个小分子的化学结构,药物分子大模型实现了一个大模型赋能药物发现全链条任务。
L2是指面向更加细分场景的推理模型。以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。
此外,在华为云AI生态中,通过开源开放,盘古大模型将借助开发者和合作伙伴的力量,比如将L1行业大模型开放给ISV伙伴等,将大模型的能力进一步下沉到场景,普惠给更多企业。
“未来我们就是两条线,一是从练大模型到练好大模型,二是从用大模型到用好大模型。”
作为盘古大模型的“总设计师”,田奇分享了其未来的发展路径。他表示,在练好大模型方面,涉及很多前沿技术创新,需要联合高校和科研院所,发挥产学研融合的力量。比如大模型架构的创新、解决大模型资源消耗大、缺乏逻辑等问题。在用好大模型方面,“大模型也不是万能的,不一定能解决所有的问题,一定要找到高价值的场景,找到更适合大模型发挥作用的地方。”
“现在大模型大部分架构是基于Transformer等,大模型到底应该是什么样的结构,数据驱动怎么样跟知识结合在一起来训练大模型,这些都是‘练好大模型’值得探讨的地方。”中国科学技术大学信息学院常委副院长李厚强表示。
向上生长:五大优势,解决行业个性化难题
有了强壮的根系,要想持续向上伸展枝叶,必须把大模型放在具体行业中,放在企业核心生产系统中检验。目前,虽然推出预训练大模型的科技企业很多,但在落地应用方面,「智能进化论」认为,华为云盘古是走得最快的大模型之一。
“盘古大模型今年的一个重要目标,就是落地行业创造更大价值,形成关键技术的一些壁垒,为煤矿、水利、电力、金融、农业等行业创造更大的产业价值。”田奇表示。目前,盘古大模型已经在工业、城市、能源、金融、气象等多行业落地,在电路巡检、制造业工艺优化、工业质检等一百多个场景业务中实际应用。
在探索大模型落地方面,各个科技企业的策略和路径各不相同,有的以技能来划分大模型,有的推出众多细分行业大模型。华为云盘古大模型走的是强化通用性、泛化性的路线。“对行业落地来讲,我们本质上不希望一个行业一个模型,更希望打造一些通用的模型。”田奇表示。
以新推出的图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。
比如,在智能分析场景下,图网络大模型帮助广发证券将企业异常财务识别准确率提高到90%,相对于原来的小模型方法提升了20%,实现了行业领先。
在时序预测场景下,图网络大模型帮助中央空调系统进行可挥发气体浓度的预测,智能监测空气质量,同时也在帮助零售企业进行销量预测。
在工艺优化场景下,图网络大模型则可以帮助制造行业优化工艺、降本增效。
田奇介绍,经过两年的迭代,华为云盘古大模型已经形成了五大优势,包括:AI开发门槛低、泛化性能高、样本标注快、模型精度高、场景通用性强。在这些优势的加持下,越来越多企业、机构正在将盘古大模型应用到核心生产环境。
比如,CV(视觉)大模型此前已成功应用在铁路巡检、国家电力巡检等场景,目前正被更多制造企业应用在工业质检环节。华为南方工厂的PCB版质检就是借助了盘古CV(视觉)大模型展开。
NLP(中文语言)大模型方面,通过跨语言模型迁移,盘古研发团队还在尝试通过中文大模型、英文大模型加速对其他小语种大模型的训练,如阿拉伯语大模型、西班牙语大模型等。
根系互补:大模型+知识计算+AI求解器形成合力
在AI落地的道路上,大模型不是孤立的单打独斗,因为人工智能算法必须结合行业Know-How和企业专有数据,才能完成通用到专用的转变。
知识计算是指利用AI技术实现机器将人类知识转化为可计算的模型。过去,各个行业都有各种形态的知识,它们存在于不同的媒介,比如各种专业书籍的学科知识,百科网站的基本常识,专家头脑中的经验沉淀等。知识计算是实现行业知识与AI结合的全新路径。
在煤炭焦化行业,配煤优化是一项颇具技术含量的工艺,是工厂煤耗和焦炭质量的关键保证。过去,传统的配煤只能依靠配煤师的个人经验,存在主观性、不稳定性而且难以传承。基于盘古Graph大模型和知识计算,华为云为鞍钢集团打造了智慧配煤解决方案。如今,操作人员只需要在系统中输入配炼焦炭的四种原料成分相关比例,系统就能自动计算焦炭中的成焦质量,配煤仅耗费1~2分钟,质量预测准确率达到95%,在确保焦炭质量的前提下,平均配煤成本下降超过5元。以年产量200万吨焦炭为例,企业可节省成本上千万元。
此外,华为云天筹AI求解器将运筹学和人工智能相结合,帮助突破业界运筹优化极限。它支持亿级规模问题的求解,求解速度最高可以提升100倍,建模效率最高提升30倍,求解效率最高提升30%。
“大模型、知识计算、求解器不是对立的,而是相辅相成的,可以是相互结合,相互帮助的。”田奇表示。
写在最后
今天,人工智能已经深刻改变了我们的生产和生活。但是从独立学科的发展来看,人工智能还处于发展早期。
“人工智能的发展处于初期阶段,科研工作者需要充分利用知识、数据、算法、算力这四个要素,建立可解释和鲁棒的人工智能理论,发展可控、可信、可靠、可扩展的人工智能技术,探索出一条适合人工智能的全新发展道路。”中国科学院院士、清华大学人工智能研究院名誉院长张钹在会上表示。
只有根系茁壮,才能枝繁叶茂,果实累累。华为云聚焦AI根技术的研发与应用,为AI产业落地探索了一条关键路径。
“华为云把AI技术和应用经验化、云化,让更多企业像使用水电一样使用全球领先的数字技术,促进AI高效地走进企业。”华为公司董事、科学家咨询委员会主任徐文伟表示。