MAPREDUCE服务 MRS-配置MapReduce任务日志归档和清理机制:配置场景
配置场景
执行一个MapReduce应用会产生两种类型日志文件:作业日志和任务日志。
- 作业日志由MRApplicationMaster产生,详细记录了作业启动时间、运行时间,每个任务启动时间、运行时间、Counter值等信息。此日志内容被HistoryServer解析以后用于查看作业执行的详细信息。
- 任务日志记录了每个运行在Container中的任务输出的日志信息。默认情况下,任务日志只会存放在各NodeManager的本地磁盘上。打开日志聚合功能后,NodeManager会在作业运行完成后将本地的任务日志进行合并,写入到HDFS中。
由于MapReduce的作业日志和任务日志(聚合功能开启的情况下)都保存在HDFS上。对于计算任务量大的集群,如果不进行合理的配置对日志文件进行定期归档和删除,日志文件将占用HDFS大量内存空间,增加集群负载。
日志归档是通过Hadoop Archives功能实现的,Hadoop Archives启动的并行归档任务数(Map数)与待归档的日志文件总大小有关。计算公式为:并行归档任务数=待归档的日志文件总大小/归档文件大小。
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是Flink_如何使用Flink
- 大数据分析是什么_使用MapReduce_创建MRS服务
- 如何配置云日志告警_日志告警配置_云日志服务LTS-华为云
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是ClickHouse_如何使用ClickHouse
- 日志监控与告警_日志告警规则_如何配置日志告警_日志分析_日志服务
- MapReduce服务_什么是Flume_如何使用Flume