MAPREDUCE服务 MRS-Spark应用执行过程中,日志中一直打印getApplicationReport异常且应用较长时间不退出:回答
回答
在Spark中有个定期线程,通过连接RM监测AM的状态。由于连接RM超时,就会报上面的错误,且一直重试。RM中对重试次数有限制,默认是30次,每次间隔默认为30秒左右,每次重试时都会报上面的错误。超过次数后,driver才会退出。
RM中关于重试相关的配置项如表1所示。
参数 |
描述 |
默认值 |
---|---|---|
yarn.resourcemanager.connect.max-wait.ms |
连接RM的等待时间最大值。 |
900000 |
yarn.resourcemanager.connect.retry-interval.ms |
重试连接RM的时间频率。 |
30000 |
重试次数=yarn.resourcemanager.connect.max-wait.ms/yarn.resourcemanager.connect.retry-interval.ms,即重试次数=连接RM的等待时间最大值/重试连接RM的时间频率。
在Spark客户端机器中,通过修改“conf/yarn-site.xml”文件,添加并配置“yarn.resourcemanager.connect.max-wait.ms”和“yarn.resourcemanager.connect.retry-interval.ms”,这样可以更改重试次数,Spark应用可以提早退出。
- 华为VNC_VNC使用教程_VNC免安装-华为云
- GaussDB查版本命令_GaussDB命令参考_高斯数据库查版本命令-华为云
- ModelArts推理部署_创建AI应用_自定义镜像规范-华为云
- 工作负载_云容器引擎_什么是工作负载
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce服务_什么是Flink_如何使用Flink
- 编译构建最佳实践使用Maven构建包制作Docker镜像
- GaussDB命令_GaussDB数据库命令_高斯数据库命令-华为云
- 应用性能管理定位请求异常原因_云应用性能问题诊断_ 应用性能管理 APM-华为云
- 区块链服务联盟链管理_华为云区块链联盟链管理_华为云区块链联盟链管理