大数据集群搭建-产品介绍
版本: V1.0 | 交付方式: 人工服务 |
适用于: Linux | 上架日期: 2023-04-17 09:18:17.0 |
1. CDH简介
在商业应用中,对于企业成百上千的机器集群进行安装hadoop一系列组件费时费力,而且hadoop各个 开源 组件版本混乱,管理升级也比较困难,对于企业日常的管理维护带来极大不b便,现在商用的比较流行国外的是CDH(Cloudera’s Distribution Including Apache Hadoop),国内是星环、华为等公司,他们改造封装了HADOOP生态组件来出售。
CDH,是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,版本清晰,更新快,文档全。
Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称“CDH”),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop,简化了 大数据 平台的安装、使用难度。
1.1 为什么选择CDH部署Cluster
1)CDH基于稳定版Apache Hadoop,并应用最新Bug修复或者Feature的Patch
2)Cloudera官网上安装、升级文档十分详细
3)CDH支持Yum包、tar包、RPM包,Cloudera Manager四种安装方式。推荐使用Yum、Apt方式安装
1. 2 Cloudera Manager的功能
1)管理:对集群进行管理,例如添加、删除节点等操作
2)监控:监控集群的健康情况,对设置的各种指标和系统的具体运行情况进行全面的监控
3)诊断:对集群出现的各种问题进行诊断,并且给出建议和 解决方案
4)集成:多组件可以进行版本兼容间的整合
---适应初学者或者开始学习大数据的开发人员使用