华为云计算 云知识 华为云全域Serverless技术创新:全球首创通用Serverless平台被ACM SIGCOMM录用
华为云全域Serverless技术创新:全球首创通用Serverless平台被ACM SIGCOMM录用
摘要:华为云全域Serverless化背后的“基石”——元戎,中稿全球顶尖学术会议ACM SIGCOMM 2024。

该会议在计算机科学领域享有崇高声望,2024年共接收投稿366篇,其中62篇被录用,录用率仅为16.9%。论文《YuanRong: A Production General-purpose Serverless System for Distributed Applications in the Cloud》揭示了华为自主创新的业界首个通用Serverless平台,提供通用函数编程模型,高可扩缩、高性能和高效对接后端服务的运行框架,助力华为云构建全域Serverless 云服务

从专用走向通用

当前,业界现有的Serverless产品主要限于事件驱动型应用,然而对于有状态微服务、 大数据 、HPC、AIGC等复杂应用,仍然面临如下四大核心技术挑战:

函数间无法高效协同

函数间无法直接寻址,需绕走网关,导致互调性能差。函数间不支持共享内存,无法高效协同,难以满足微服务、HPC等场景对低时延的诉求。

不确定的冷启动时延

冷启动是Serverless性能优化难题之一,尤其在微服务、AIGC等场景,容器启动时加载大 镜像 (GB级)的开销大,加之复杂的应用初始化过程,整个冷启动耗时分钟级,无法按需弹性。

状态外置影响性能

应用程序的状态必须外置到如OBS等远端存储,延迟可达数百毫秒,同时远端存储的带宽有限导致吞吐量低,难以满足大数据等场景多任务之间高效数据流转的诉求。

用户函数和后端服务间交互复杂

后端服务通常是有状态的,并为每个客户端维护经过身份验证的活动连接,例如JDBC连接,但这些连接状态很难在协作的函数实例之间共享。此外,多个函数的并发操作也会导致分布式事务的问题。

元戎首创通用平台

论文介绍了元戎通用Serverless平台的一系列关键创新。

其中,针对挑战1和2,元戎构建了可扩展的函数系统,实现大规模函数调度、亚毫秒函数互调以及函数极速冷启动等关键技术,支持大规模多形态应用的统一管理和高效运行;
针对挑战3,元戎内置了多语义数据系统,实现分布式共享内存对象以及流数据对象,提供分布式共享内存池,支持多语义数据的高效流转;
针对挑战4,元戎构建了可移植的Bridge系统,提供事件和后端服务的标准抽象接口,解耦架构,同时支持连接复用和共享事务等功能。
元戎进一步抽象了面向 云原生 编程的通用Serverless运行时接口,并实现了主流语言的Runtime。通过这些Runtime,元戎为开发者提供特定领域的简易编程模式,支持Web服务、大数据、AI训练/推理、HPC等全域Serverless应用。
近年来,华为云持续构筑全域Serverless云服务,推出了一系列竞争力领先的Serverless产品,包括华为云 函数工作流 FunctionGraph、Serverless容器引擎CCE Autopilot、Serverless应用托管CAE、云 数据仓库 DWS、事件网格EventGrid等,高效支撑Serverless全面商业化。
面向生成式AI浪潮,元戎通用Serverless将持续聚焦技术创新,突破大模型推理服务实例快速弹性、分布式KV Cache池化管理、多模型混部高效协同调度、超大规模分布式训练高可用性等关键技术,构筑大模型推理和训练的高性能、低成本、高可用性关键竞争力。
通过这些创新,元戎将助力华为云打造极低成本、极致性能和极优体验的Serverless AI 解决方案 ,实现全域Serverless化的竞争力领先,帮助千行万业的百万开发者缩短交付周期,提升上云效率,抢占市场先机。
华为云Serverless 应用中心:https://www.huaweicloud.com/product/functiongraph/applications.html

函数工作流 FunctionGraph

函数工作流(FunctionGraph)是一项基于事件驱动的函数托管计算服务。通过函数工作流,只需编写业务函数代码并设置运行的条件,无需配置和管理服务器等基础设施,函数以弹性、免运维、高可靠的方式运行。此外,按函数实际执行资源计费,不执行不产生费用