华为云存储创新LAB与华中科技大学、香港中文大学/复旦大学/中山大学合作的两项研究成果被FAST’23接收!
FAST (USENIX Conference on File and Storage Technologies)是存储系统领域的顶级会议,入选中国计算机协会(CCF)推荐A类国际会议列表,本次共投稿123篇论文,接收28篇,录用率22.8%。华为云存储创新LAB和华中科技大学、香港中文大学/复旦大学/中山大学合作分别提出业界首个基于分离式内存架构的Learned Index (ROLEX)和Fault-Tolerant Key-Value Store (FUSES),两篇论文被FAST’23接收!这是继RACE Hashing (USENIX ATC’21)和FORD (FAST’22)之后,我们LAB在分离式内存系统方向上的又两个重要研究成果。
【论文1信息】
Jiacheng Shen, Pengfei Zuo, Xuchuan Luo, Tianyi Yang, Yuxin Su, Yangfan Zhou, Michael Lyu, “FUSES: A Fully Memory-Disaggregated Key-Value Store”, accepted and to appear in the 21st USENIX Conference on File and Storage Technologies (FAST), 2023.
【论文2信息】
Pengfei Li, Yu Hua, Pengfei Zuo, Zhangyu Chen, Jiajie Sheng, “ROLEX: A Scalable RDMA-oriented Learned Key-Value Store for Disaggregated Memory Systems”, accepted and to appear in the 21st USENIX Conference on File and Storage Technologies (FAST), 2023.
【论文1简介】
近年来,分布式键值存储开始使用内存分离架构来提高其资源利用率。然而,现有内存分离的键值存储采用了一种部分内存分离的设计,在元数据管理上使用了占用额外资源的单体服务器,仍然有资源利用不完全的问题。本文提出将元数据管理内存分离化并设计了 FUSES,一个完全内存分离的键值存储系统,来解决现有内存分离架构下键值存储的资源使用问题。FUSES允许客户端直接访问存储在分离式内存节点上的数据和元数据,并对数据和元数据维护副本来处理内存分离架构下的多种错误情况。FUSES提出了三项技术来解决在完全内存分离架构下的数据副本、内存管理和元数据损坏问题。首先,FUSES提出了一个全单边哈希索引复制协议来支持客户端并发访问和修改所有的哈希索引副本。其次,FUSES采用了两级内存管理方案,将内存管理的任务分配给客户端和内存节点来进行高效内存分配。最后,FUSES提出了一种嵌入式日志方案来修复损坏的元数据而不引入过多的日志维护开销。实验结果表明,相比现有分离内存下的键值存储,FUSES在使用更少资源的情况下在YCSB基准测试上达到了4.5倍的性能提升。该论文是由来自香港中文大学的实习生沈家诚在云存储创新LAB左鹏飞博士的指导下完成。
【论文2简介】
分离式内存系统将传统的单体服务器中的不同资源解耦成不同的部分,包括计算资源池和内存资源池,以享受高的资源利用率、灵活的硬件可扩展性和高效的数据共享等好处。通过利用高性能的RDMA网络,计算节点可以直接访问远程内存池而不涉及远程的CPU。因此,有序键值 (KV) 存储(例如 B 树和学习型索引)可以通过高性能网络来提供范围查询服务。然而,现有的有序 KV存储无法在分离式内存系统上很好地工作,因为要么消耗多次网络往返来搜索远程数据,要么严重依赖计算资源不足的内存节点来处理数据修改请求。在本论文中,我们提出了具有可扩展的面向 RDMA优化的学习型KV 存储,称为 ROLEX,以在分离式内存系统上实现高效的数据存储和检索。ROLEX 提出了一个重训练解耦的学习索引方案,通过向学习模型中添加偏差和一些数据移动约束,将模型重训练与数据修改操作解耦。基于这个操作解耦,我们可以通过单侧RDMA原语在计算节点上远程执行数据修改,从而具有高扩展性。模型重新训练也从数据修改的关键路径中移除了,通过使用内存节点中的专用计算资源异步执行。基于YCSB和真实工作负载的实验结果表明,ROLEX 在静态工作负载上实现了高的性能,并且在动态工作负载上的性能比分离式内存上最先进的方案高出 2.2 倍。该论文是在云存储创新LAB MemArts团队和华中科技大学华宇老师团队的合作项目中完成。
附:华为云存储创新LAB在分离式内存方向上的研究成果
1.Pengfei Zuo, Jiazhao Sun, Liu Yang, Shuangwu Zhang, Yu Hua, “One-sided RDMA-Conscious Extendible Hashing for Disaggregated Memory”, Proceedings of the USENIX Annual Technical Conference (USENIX ATC), 2021.
2.Ming Zhang, Yu Hua, Pengfei Zuo, Lurong Liu, “FORD: Fast One-sided RDMA-based Distributed Transactions for Disaggregated Persistent Memory”, Proceedings of the 20th USENIX Conference on File and Storage Technologies (FAST), 2022.
3.Pengfei Zuo*, Qihui Zhou*, Jiazhao Sun, Liu Yang, Shuangwu Zhang, Yu Hua, James Cheng, Rongfeng He, Huabing Yan, “RACE: One-Sided RDMA-Conscious Extendible Hashing”, ACM Transactions on Storage (TOS) 18.2 (2022): 1-29.
4.Jiacheng Shen, Pengfei Zuo, Xuchuan Luo, Tianyi Yang, Yuxin Su, Yangfan Zhou, Michael Lyu, “FUSES: A Fully Memory-Disaggregated Key-Value Store”, accepted and to appear in the 21st USENIX Conference on File and Storage Technologies (FAST), 2023.
5.Pengfei Li, Yu Hua, Pengfei Zuo, Zhangyu Chen, Jiajie Sheng, “ROLEX: A Scalable RDMA-oriented Learned Key-Value Store for Disaggregated Memory Systems”, accepted and to appear in the 21st USENIX Conference on File and Storage Technologies (FAST), 2023.