检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装NPD插件后,当节点出现异常时,控制台上可以查看到指标异常。 您还可以在节点事件中查看到NPD上报的事件,根据事件信息可以定位故障。 表1 故障事件说明 故障事件 说明 OOMKilling 检查oom事件发生并上报。 可能原因:用户在ECS侧误操作卸载数据盘。 处理建议:排查项一:节点负载过高。
dir=obs://{bucket-name}/{log-dir}/ EOF spark.eventLog.enabled:设置为true,表示开启Spark事件日志记录。 spark.eventLog.dir:OBS桶名称及路径,格式为obs://{bucket-name}/{l
用集群或者修复节点异常,当某个控制节点故障时,不影响集群业务。 集群当前时间CPU的Request水位是否超过80% 是 Request代表工作负载运行的最低资源要求,集群水位过高,剩余资源不能够满足新应用Request要求时,应用将不能被创建。需要根据业务情况,合理规划资源分配。详情请参见设置容器规格。