对象存储服务 OBS-方案概述:方案优势
方案优势
相比传统企业在本地IDC机房部署大数据业务,华为云数据存算分离方案的主要优势如表2。
序号 |
主要优势 |
详细描述 |
---|---|---|
1 |
融合高效,协同分析 |
|
2 |
存算分离,资源利用率高 |
计算存储解耦,支持独立扩容或缩容,计算资源可弹性伸缩,资源利用率提升。 |
3 |
数据EC冗余存储,利用率高,成本低 |
对象存储服务 OBS支持利用率最高的分布式数据容错技术Erasure code,磁盘利用率大幅提升,数据存储空间需求远低于三副本。 |
此外,对象存储服务OBS提供了OBSFileSystem插件(OBSA-HDFS),可与上层大数据平台无缝对接,实现业务零改造。
OBSFileSystem的主要作用:提供HDFS文件系统的相关接口实现,让大数据计算引擎(Hive、Spark等)可以将OBS作为HDFS协议的底层存储。
OBS服务支持对象存储桶(对象语义)和并行文件系统(POSIX文件语义),在大数据场景下建议选择并行文件系统。并行文件系统支持POSIX文件语义,通过OBSFileSystem封装,相较对象语义增加Rename、Append、hflush/hsync接口,实现完善的HDFS语义,为大数据计算提供了更好的性能。
基于上述优势,华为云存算分离大数据方案相比传统大数据方案,在同样的业务规模下所使用的计算资源、存储资源以及服务器数量都会有明显下降,同时资源利用率也能得到显著提升,可帮助企业降低业务综合成本。