技术创新
“只做事”的大模型成就真英雄

活明白的冯唐说:“煲汤比写诗重要。”我深以为然。华为云说盘古大模型:“不写诗,只做事。”我更想强烈表达认同。“大模型”有太多的事情可以做,也有太多的事情要去做,哪一件事情都比写诗重要。

一等大事“打基础”

摩拳擦掌久矣。

两年前的HDC.Cloud,华为云就在这里正式发布盘古大模型。两年后的HDC.Cloud,华为云又是在这里发布盘古大模型3.0。

开发者对此摩拳擦掌久矣。他们知道盘古大模型一定会上新,毕竟这两年里,华为云一直在快速迭代盘古大模型;他们也知道盘古大模型上新的同时,一定会送出生态“大礼包”,毕竟这是华为云的传统。

果不其然。

华为云没有让开发者失望。在定下“不做诗、只做事”的基调后,盘古大模型3.0并没先想着去画“宫保鸡丁”,也没去想着怎么展示“鸡兔同笼”,它琢磨的一等大事是“建生态”、“打基础”。

“当前盘古大模型的生态系统已初具规模,众多行业头部客户和伙伴正在与华为云联合创新,基于盘古开发与各具特色的行业大模型,升级各行各业的解决方案。我相信,盘古大模型的生态一定会更加蓬勃发展,成为行业智能化升级的中坚力量。”康宁是华为云全球生态部总裁,他直接切入主题,并进一步提出组建“高质量数据联盟”,就是生态的一部分。

想想还真是这个道理。

数据才是大模型存在的基础和发展的关键。只有多看书、看好书、多看专业的好书,至少不能会被“毒教材”带跑偏,才能让大模型不断地学习和优化。

也正是为了夯实这一基础,华为云与中国公共关系协会、文化大数据产业委员会共同发起,多家伙伴共同倡议,成立大模型高质量数据联盟。“我们希望通过‘高质量数据联盟’,汇聚成员单位开放的各类数据,打造覆盖千行百业的高质量数据集,共训共享基础大模型。欢迎各行业机构,企业单位加入高质量数据联盟。”康宁说。

生态“大礼包”

而更进一步,华为云还希望为开发者和生态伙伴多做几件事情。或者说,华为云是送出了一系列生态“大礼包”,而且他真的很懂开发者,技术礼包和服务礼包都能送到开发者的心坎上。

通常而言,开发者都会关心几个问题:例如,行业API是否丰富,调用API是否顺手,毕竟用户关注的是通用大模型,但需要的是行业大模型或企业大模型;再例如,大模型的工具套件是否丰富,应用开发是否友好,毕竟这决定了开发效率。

回答上述问题,康宁先是列举了一系列数据,进而又派送出一系列生态技术“大礼包”:“华为云开天aPaaS已经汇聚了13.6万个场景API,API与业务匹配度达到95%,应用上线周期从过去月级缩短至天级。”

看来,坚持“爬北坡的华为云”对“做事情的大模型”,已经有相当的行业自信。其很希望以这种“盘古+开天”的组合,为开发者辟开另一片天地。

当然,对于技术能力,华为云也一向开放,而且其大模型工具套件,已经越发开放友好。康宁说:

在模型生产领域,华为云提供了覆盖数据处理,模型的开发训练与部署,以及模型微调的多种工具,可显著提升开发者的模型生产效率;在模型应用领域,华为云不仅提供80多种模板的提示词工程和50多种模型技能,还提供模型工具集,让开发者更加灵活的实现对大模型的使用。

不仅如此。

华为云还为开发者做了几件事情,这也是盘古大模型生态“大礼包”的一部分:例如,如果开发者找资料、找数据集、算法、模型,可以去“大模型专属社区”;如果想学习,可以去“云课堂”;如果找老师,可以联系DTSE全能专家。

除此之外,如果你找合作伙伴,想深入行业数字化,就去“开发者创新中心”;如果想检验一下学习成果,并与同行交流,就去参加“华为开发者大赛”。总之,只要你想找,就能找到,只要你想学,就一定能学会。

不作诗、只做事

更重要的是,相比那些“忽如一夜春风来”的大模型,盘古也很值得信任。因为“不作诗、只做事”的盘古大模型,就是华为云的明确的业务思路——在行业中多做实事,多为用户输送“行业专家”,至少也需要多提供些“工作助理”。

其实,盘古大模型肯定是会写诗的,2021年,华为云发布的盘古大模型1.0,就包括NLP大模型。但华为云真的抓住了开发者的心理——你要跟开发者聊大模型生成的“宫保鸡丁”,他们也许会微微一笑,但你要给开发者展示,大模型下注视下的煤矿传输皮带抖动检测,他们一定会举起手机认真拍照。

或者说,开发者不会去纠结,在所谓的“千模大战”中,谁是“超模”,谁是“野模”?但他们一定会关注谁在写诗,谁只做事,关注谁家的大模型在行业中落地最扎实,以及业内又出现了哪些行业大模型。

盘古大模型恰恰是行业落地最扎实的那个,也是最想着为用户踏踏实实地做点事。2021年4月,华为云正式发布盘古大模型;2021年9月,华为云发布科学计算大模型和药物分子大模型;2022年6月,华为云发布盘古矿山大模型;2022年11月,华为云发布气象大模型;2023年7月,华为云发布盘古大模型3.0。

看如此节奏,华为云每隔三五个月,就会推出一款行业大模型。截至目前,华为云已陆续推出矿山、药物分子、电力、气象、海浪、铁路等大模型。本次HDC.Cloud期间,华为云又连续发布政务、金融、制造大模型,持续为业界贡献先进的算法和解决方案。

以铁路大模型为例,其能精准识别现网运行的67种货车、430多种故障,综合准确性高达99.8%。以一个中心站点为例,平均每天过站1000列车,原来需要260名列检员肉眼检查400万张检测图片,现在通过盘古铁路大模型的一双“慧眼”,无故障图片筛除率可达95%,可以轻松筛除380万张无故障图片,列检员只需复检20万张图片,效率大大提升。

成就英雄

对此,内行看门道。上述应用场景中,上述行业大模型中,其实就隐藏着众多生态合作模式。数据伙伴可以通过共享开放数据,共训共享基础大模型;咨询与集成伙伴可以协助用户,构建大模型基础设施;服务伙伴可以基于盘古大模型,为用户搭建行业大模型、企业大模型;软件伙伴既可以众筹模型算法,将行业“微场景”联接成为“大场景”,也基于华为平台为用户开发丰富的智能应用。

总之,通往大模型的路不只一条。而这正如康宁最后所说:“大模型充分融入千行百业,离不开广大开发者的积极参与。华为云希望探索盘古大模型与行业结合的创新路径,更希望成就开发者的英雄之路。”