检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
”分别为告警产生时间的前后30分钟,单击“下载”。 请联系运维人员,并发送已收集的故障日志信息。 告警清除 任务恢复正常运行或停止后,如果已经发送过告警,则告警恢复,无需手动清除。 参考信息 无。 父主题: MRS集群告警处理参考
测到组件KrbServer服务异常时产生该告警。 当检测到组件KrbServer服务恢复时告警恢复。 告警属性 告警ID 告警级别 可自动清除 25500 致命 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。
Streaming产生和保存的RDDs自动从Spark的内存中强制移除。Spark Streaming接收的原始输入数据也将自动清除。设置为false时原始输入数据和存留的RDDs不会自动清除,因此在streaming应用外部依然可以访问,但是这会占用更多的Spark内存。 true Spark Streaming
REST接口 通过以下命令可跳过REST接口过滤器获取相应的应用信息。 安全模式下,JobHistory仅支持https协议,故在如下命令的url中请使用https协议。 安全模式下,需要设置spark.ui.customErrorPage=false并重启spark2x服务
围。当检测到“非健康的节点数”的值超出阈值范围时产生该告警。 当“非健康的节点数”的值小于或等于阈值范围时,告警自动清除。 告警属性 告警ID 告警级别 可自动清除 18003 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName
“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。 请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。 父主题: MRS集群告警处理参考
“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。 请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。 父主题: MRS集群告警处理参考
Keeper实例连接数超出阈值(最大连接数的百分之八十)时产生该告警。 连接数小于阈值时,告警恢复。 告警属性 告警ID 告警级别 可自动清除 13001 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。
ID”目录下载日志。 查看失败作业日志进行故障修复,或联系运维人员,并发送已收集的故障日志信息。 告警清除 FlinkServer作业重新启动成功后,则告警恢复,无需手动清除。 参考信息 无。 父主题: MRS集群告警处理参考
值范围。当检测到“丢失的节点数”的值超出阈值范围时产生该告警。 当“丢失的节点数”的值小于或等于阈值范围时,告警自动清除。 告警属性 告警ID 告警级别 可自动清除 18002 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName
son -d '{"plainText":"<password>"}' 'https://x.x.x.x:28443/web/api/v2/tools/encrypt';其中<password>要与签发证书时使用的密码一致,x.x.x.x为集群Manager的浮动IP。 命令中如
单击右上角的编辑按钮设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。 请联系运维人员,并发送已收集的故障日志信息。 告警清除 突发并发任务执行结束后告警自动清除。 参考信息 不涉及。 父主题: MRS集群告警处理参考
集群状态 > Coordinator进程GC时间”修改阈值。当 Coordinator进程Gc时间小于或等于告警阈值时,告警清除。 告警属性 告警ID 告警级别 可自动清除 44005 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName
Streaming产生和保存的RDDs自动从Spark的内存中强制移除。Spark Streaming接收的原始输入数据也将自动清除。设置为false时原始输入数据和存留的RDDs不会自动清除,因此在streaming应用外部依然可以访问,但是这会占用更多的Spark内存。 true Spark Streaming
ID”目录下载日志。 查看失败作业日志进行故障修复,或联系运维人员,并发送已收集的故障日志信息。 告警清除 FlinkServer作业Task背压恢复或者作业重新启动成功,则告警恢复,无需手动清除。 参考信息 无。 父主题: MRS集群告警处理参考
当节点NTP服务无法与主OMS节点NTP服务正常同步时间时产生该告警。 当节点NTP服务与主OMS节点NTP服务正常同步时间时恢复该告警。 告警属性 告警ID 告警级别 可自动清除 12012 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。
per实例内存使用量超出阈值(最大内存的百分之八十)时产生该告警。 内存使用率小于阈值时,告警恢复。 告警属性 告警ID 告警级别 可自动清除 13002 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。
在时间区间选择需要查看监控数据的时间段。 自定义监控指标报表。 单击“定制”,勾选需要显示的监控指标。 单击“确定”保存并显示所选指标。 单击“清除全部”可批量取消全部选中的指标项。 导出监控指标报表。 选择报表的时间范围。 单击“导出”,MRS将生成指定时间范围内、已勾选的集群监控指
threshold:节点的过期时间,每个批次的任务都会生成对应节点,从当前批次任务的结束时间开始算,如果超过60分钟,则表示已经过期了,那么就清除节点。 batch.job.max.retry.count:单批次任务的最大重试次数,当单批次的任务失败重试次数超过这个值,就会删除该任务
threshold:节点的过期时间,每个批次的任务都会生成对应节点,从当前批次任务的结束时间开始算,如果超过60分钟,则表示已经过期了,那么就清除节点。 batch.job.max.retry.count:单批次任务的最大重试次数,当单批次的任务失败重试次数超过这个值,就会删除该任务