MAPREDUCE服务 MRS-配置Spark Eventlog日志回滚:配置场景
配置场景
当Spark开启事件日志模式,即设置“spark.eventLog.enabled”为“true”时,就会往配置的一个日志文件中写事件,记录程序的运行过程。当程序运行很久,job很多,task很多时就会造成日志文件很大,如JD BCS erver、Spark Streaming程序。
而日志回滚功能是指在写事件日志时,将元数据事件(EnviromentUpdate,BlockManagerAdded,BlockManagerRemoved,UnpersistRDD,ExecutorAdded,ExecutorRemoved,MetricsUpdate,ApplicationStart,ApplicationEnd,LogStart)写入日志文件中,Job事件(StageSubmitted, StageCompleted, TaskResubmit, TaskStart,TaskEnd, TaskGettingResult, JobStart,JobEnd)按文件的大小进行决定是否写入新的日志文件。对于Spark SQL的应用,Job事件还包含ExecutionStart、ExecutionEnd。
Spark中有个HistoryServer服务,其UI页面就是通过读取解析这些日志文件获得的。在启动HistoryServer进程时,内存大小就已经定了。因此当日志文件很大时,加载解析这些文件就可能会造成内存不足,driver gc等问题。
所以为了在小内存模式下能加载较大日志文件,需要对大应用开启日志滚动功能。一般情况下,长时间运行的应用建议打开该功能。
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 如何配置云日志告警_日志告警配置_云日志服务LTS-华为云
- 大数据分析是什么_使用MapReduce_创建MRS服务
- 日志监控与告警_日志告警规则_如何配置日志告警_日志分析_日志服务
- MapReduce服务_什么是Flume_如何使用Flume
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper
- MapReduce服务_什么是Hue_如何使用Hue
- 主机安全配置_Windows主机安全配置_Linux主机安全配置
- Hudi服务_什么是Hudi_如何使用Hudi