本课程主要介绍了 大数据 开源技术,业界常用且重要大数据组件技术原理,华为大数据FusionInsight HD 解决方案 以及大数据组件的基础操作和应用场景综合实践。
目标学员
ICT行业人才及希望学习ICT行业知识的学员
课程目标
学完本课程后,学员能够掌握常用且重要的大数据组件技术原理与架构; 能够运用华为大数据解决方案FusionInsight HD实现实际应用的基础操作,比如HDFS,HBase,操作,数据导入导出操作等。
课程大纲
第1章 大数据发展趋势与鲲鹏大数据
第2章 HDFS分布式文件系统和ZooKeeper
第3章 Hive分布式 数据仓库
第4章 HBase技术原理
第5章 MapReduce和Yarn技术原理
第6章 Spark基于内存的分布式计算
第7章 Flink流批一体分布式实时处理引擎
第8章 Flume海量日志聚合
第9章 Loader数据转换
第10章 Kafka分布式消息订阅系统
第11章 Hadoop基础技术-Kerberos&LDAP
第12章 ElasticSearch分布式全文检索服务
第13章 Redis内存 数据库
第14章 华为大数据解决方案