检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
64位系统:4194304(2的22次方) 等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行2。 检查系统环境是否异常。 联系运维人员,检查操作系统是否存在异常。 是,恢复操作系统故障,执行2.b。 否,执行3。 等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行3。 收集故障信息。 在MRS Manager界面,单击“系统设置
等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行2。 收集故障信息。 在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
等待5分钟后,单击“告警管理”,查看该告警是否恢复。 是,处理完毕。 否,执行3。 收集故障信息。 在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
b主机名一致。 是,执行1.e。 否,执行2.a。 按ALM-12006 节点故障提供的步骤处理该告警。 在告警列表中查看“ALM-25500 KrbServer服务不可用”告警是否清除。 是,处理完毕。 否,执行3。 检查OLdap服务是否不可用。 登录MRS集群详情页面,选择“告警管理”。
阈值”告警。 是,执行2。 否,执行4。 参考“ALM-16005 Hive服务进程堆内存使用超出阈值”的处理步骤处理该故障。 在告警列表中,查看该告警是否清除。 是,处理完毕。 否,执行4。 查看元数据库是否异常。 联系集群元数据库管理员查看元数据库是否有异常。 是,执行5。 否,执行6。
信息”中的“服务名”为当前HBase服务的告警。 是,单击对应告警右侧的“查看帮助”并按照帮助文档进行处理,执行8。 否,执行9。 等待5分钟,观察界面告警是否清除。 是,处理完毕。 否,执行9。 收集故障信息 在FusionInsight Manager界面,选择“运维 > 日志
“定位信息”中的“服务名”为当前HBase服务的告警。 是,单击对应告警右侧的“查看帮助”并按照帮助文档进行处理,执行8。 否,执行9。 观察界面告警是否清除。 是,处理完毕。 否,执行9。 收集故障信息 在FusionInsight Manager界面,选择“运维 > 日志 >
对系统的影响 用户无法执行新的Storm任务。 可能原因 集群中Supervisor处于异常状态。 集群中Supervisor的状态正常,但是处理能力不足。 处理步骤 检查Supervisor状态。 登录MRS集群详情页面,选择“组件管理”。 选择“Storm > Supervisor”,进入Storm服务管理页面。
可能导致上层服务无法连接DBService的数据库,影响正常业务。 可能原因 数据库连接数使用过多。 数据库连接数最大值设置不合理。 告警阈值配置或者平滑次数配置不合理。 处理步骤 检查数据连接数是否使用过多 在FusionInsight Manager主页,单击左侧服务列表的DBService服务,进入DBService监控页面。
Storm应用开发简介 简介 Storm是一个分布式的、可靠的、容错的数据流处理系统。它会把工作任务委托给不同类型的组件,每个组件负责处理一项简单特定的任务。Storm的目标是提供对大数据流的实时处理,可以可靠地处理无限的数据流。 Storm有很多适用的场景:实时分析、在线机器学习、持
Hive常见问题 如何删除所有HiveServer中的永久函数 为什么已备份的Hive表无法执行drop操作 如何在Hive自定义函数中操作本地文件 如何强制停止Hive执行的MapReduce任务 Hive不支持复杂类型字段名称中包含哪些特殊字符 如何对Hive表大小数据进行监控
直接内存溢出可能导致服务崩溃,Flume实例不可用。 可能原因 节点Flume实例直接内存使用率过大,或配置的直接内存不合理,导致使用率超过阈值。 处理步骤 检查直接内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > Flume直接内存使用率
单个CCWorker内部平均read请求处理时延超过最大阈值后,可能会出现缓存性能下降。 可能原因 上层计算服务(Spark/Hive/HetuEngine等)对MemArtsCC组件的并发请求数激增,或者业务突增服务负载增加,或者磁盘负载增加乃至故障等。 处理步骤 登录FusionInsight
产生告警的主机名 对系统的影响 用户执行提交作业失败。例如:通过REST接口提交作业可能失败。 可能原因 该节点JobServer实例存在异常。 处理步骤 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > JobServer提交作业接口失败率 > 定位
产生告警的主机名 对系统的影响 用户执行终止作业失败。例如:通过REST接口终止作业可能失败。 可能原因 该节点JobServer实例存在异常。 处理步骤 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > JobServer提交作业接口失败率 > 定位
若CPU使用率超过阈值,扩容CPU。 检查该告警是否恢复。 是,处理完毕。 否,执行3。 收集故障信息。 在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
若内存使用率超过阈值,扩容内存。 等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行2。 收集故障信息。 在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
提升网口速率。 检查该告警是否恢复。 是,处理完毕。 否,执行9 收集故障信息。 在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
提升网口速率。 检查该告警是否恢复。 是,处理完毕。 否,执行9 收集故障信息。 在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
之80)。 是,执行9。 否,执行11。 参考ALM-12017 磁盘容量不足(2.x及以前版本)进行处理,对磁盘进行扩容。 在“告警管理”页签,查看该告警是否恢复。 是,处理完毕。 否,执行11。 检查网络状态。 在ZooKeeper实例所在Linux节点使用ping命令,看能