展现领先科研实力:华为云数据库创新LAB三篇论文入选国际数据库顶级会议VLDB'2022
9月5日,数据库顶级国际会议VLDB(International Conference on Very Large Databases)于澳大利亚悉尼召开。VLDB(CCF A类)与SIGMOD、ICDE并称数据库三大顶级会议。此次,华为云数据库创新LAB有三篇论文被VLDB收录,研究内容包含内存数据库索引、时间序列异常检测、时间序列预测等方向:
《Index Checkpoints for Instant Recovery in In-Memory Database Systems》:本论文在业内首次提出针对内存数据库索引结构的频繁检查点技术,填补了学术和工业界在内存数据库索引数据快速恢复方向的技术空白。该技术是华为云原生数据库HiEngine追求极致RTO恢复目标的关键,与学术界经典的SiloR系统的200s恢复时间相比有极大的提升;该技术也能保证检查点执行期间系统性能几乎不发生抖动,确保数据库用户的体验。
《Unsupervised Time Series Outlier Detection with Diversity-Driven Convolutional Ensembles》:在时序数据库领域,对已写入的数据做异常检测是数据库的重要功能之一。针对时间序列数据的异常检测问题,本文提出了基于CNN-AutoEncoder和集成学习技术的CAE-ENSEMBLE深度神经网络算法,并通过大量的实验证明CAE-ENSEMBLE算法能有效提高时间序列离群点检测的准确度与效率。
《METRO:A Generic Graph Neural Network Framework for Multivariate Time Series Forecasting》:对库内的数据进行时序预测是时序数据库的一大亮点功能。针对时序预测问题,本论文提出了时序预测算法METRO。METRO是基于自注意力机制(self-attention)的深度学习算法。该算法能有效学习历史数据的多种周期性以及提取不同时间线的相关性,为时序预测任务提供更准确的结果,使时序数据库具有强大的分析能力。目前METRO已经作为GaussDB for Influx的时序预测算子在华为云上线,应用场景包括对服务器容量指标进行预测,指导服务器扩容操作;以及对交通路段拥堵程度预测,动态指导地图路径规划等。结合METRO提供的强大分析能力以及GaussDB for Influx已有的超大规模时间线快速读写能力,GaussDB for Influx已具备从大规模时序数据中持续挖掘数据潜在价值的能力。