检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
le”文件。 当用户正在查看即将被回收的Spark应用时,可能会出现找不到“temp_shuffle”文件的错误,从而导致当前页面无法访问。 如果遇到上述问题,可参考以下两种方法解决。 重新访问这个Spark应用的HistoryServer页面,即可查看到正确的页面信息。 如果用
登录Manager。 MRS 3.x之前版本,执行7。 MRS 3.x及之后版本,选择“集群 > 服务 > Hive”,在服务“概览”页面右上角单击“更多”,查看“启用Ranger鉴权”是否置灰。 是,执行2。 否,执行7。 选择“集群 > 服务 > Ranger”,单击“基本信息”区域中的“RangerAdmin”,进入Ranger
Manager首页,选择“运维 > 告警 > 告警”,查看“告警ID”为“19034”的告警的“定位信息”中上报该告警的服务实例和主机名。 检查是否存在慢盘故障。 在FusionInsight Manager的告警列表中,查看1中的告警实例是否有“慢盘故障”或“磁盘不可用”告警产生。
检查ZooKeeper服务状态。 在FusionInsight Manager的服务列表中,查看ZooKeeper运行状态是否为“良好”。 是,执行5。 否,执行2。 在告警列表中,查看是否有“ALM-13000 ZooKeeper服务不可用”告警产生。 是,执行3。 否,执行5。
Manager的服务列表中,查看HDFS运行状态是否为“良好”。 是,执行5。 否,执行2。 在告警列表中,查看是否有“ALM-14000 HDFS服务不可用”告警产生。 是,执行3。 否,执行5。 参考ALM-14000 HDFS服务不可用的处理步骤处理该故障。 等待几分钟后,在告警列表中查看“Oo
Flume运维管理 Flume常用配置参数 Flume日志介绍 查看Flume客户端日志 查看Flume客户端监控信息 停止或卸载Flume客户端 父主题: 使用Flume
Flume运维管理 Flume常用配置参数 Flume业务配置指南 Flume日志介绍 查看Flume客户端日志 查看Flume客户端监控信息 停止或卸载Flume客户端 父主题: 使用Flume
单击“启动实例”,根据界面提示启动实例。 等待2分钟,查看告警是否消失。 是,处理完毕。 否,执行8。 查看业务是否存在大SQL任务 在“计算实例”页签,展开对应租户下的实例,单击计算实例“WebUI”列的“LINK”,查看所有任务的运行情况。 在“Sort”列选择“Execution
续超过阈值”,检查该告警的“定位信息”,查看并记录告警上报的任务名。 选择“集群 > 服务 > Yarn”,单击“ResourceManager WebUI”后的链接进入Yarn原生页面。 根据告警“定位信息”中的任务名找到异常任务,查找并记录作业的“application ID
登录故障节点。 执行以下命令来查看当前omm用户密码设置信息: chage -l omm 检查系统提示信息,是否用户已过期。 查找“Password expires”对应值,查看密码设置是否即将过期。 查找“Account expires”对应值,查看用户设置是否即将过期。 如果参
登录故障节点。 执行以下命令来查看当前ommdba用户密码设置信息: chage -l ommdba 检查系统提示信息,是否用户已过期。 查找“Password expires”对应值,查看密码设置是否即将过期。 查找“Account expires”对应值,查看用户设置是否即将过期。
选择“运维 > 告警 > 告警”,在告警列表中查看是否有“节点故障”告警产生。 是,执行3。 否,执行6。 查看告警信息里的主机名是否和1主机名一致。 是,执行4。 否,执行6。 按“ALM-12006 节点故障”提供的步骤处理该告警。 在告警列表中查看“LdapServer服务不可用”告警是否清除。
ger鉴权? 回答 登录FusionInsight Manager,选择“集群 > 服务 > 服务名称”,在服务详情页上继续单击“更多”,查看“启用Ranger鉴权”是否为可单击? 是,表示当前本服务未启用Ranger鉴权插件,可单击“启用Ranger鉴权”启用该功能。 否,表示
ger鉴权? 回答 登录FusionInsight Manager,选择“集群 > 服务 > 服务名称”,在服务详情页上继续单击“更多”,查看“启用Ranger鉴权”是否为可单击? 是,表示当前本服务未启用Ranger鉴权插件,可单击“启用Ranger鉴权”启用该功能。 否,表示
管理Kafka Topic 查看Kafka Topic信息 修改Kafka Topic配置 增加Kafka Topic分区 管理Kafka Topic中的消息 查看Kafka数据生产消费详情 父主题: 使用Kafka
ication Queues”中查看root队列是否资源用满。 是,执行3。 否,执行4。 对Yarn服务的NodeManager实例进行扩容。扩容后,查看告警是否消除。 是,处理完毕。 否,执行6。 检查队列最大资源容量和AM最大资源百分比 查看pending任务对应的队列的资源是否用满。
隔离主机、启动所有角色、停止所有角色 支持 支持 下载客户端、启动服务、停止服务、滚动重启服务 支持 支持 查看服务实例状态、参数配置、同步配置 支持 支持 查看清除告警、查看事件 支持 支持 查看告警帮助 支持 支持 阈值类告警的阈值设置 不支持 支持 添加消息订阅规格 支持 不支持 文件管理
登录MRS集群详情页面,在“告警管理”页面查看是否存在“ALM-14001 HDFS磁盘空间使用率超过阈值”告警。 是,执行1.b。 否,执行2.a。 参考ALM-14001 HDFS磁盘空间使用率超过阈值进行处理,查看对应告警是否清除。 是,执行1.c。 否,执行3。 等待5分钟后,在“告警管理”页面查看本告警是否清除。
检查DBService服务状态。 在FusionInsight Manager的服务列表中,查看DBService运行状态是否为“良好”。 是,执行5。 否,执行2。 在告警列表中,查看是否有“ALM-27001 DBService服务不可用”告警产生。 是,执行3。 否,执行5。
和WebHCat进程状态显示为故障,重启之后仍为故障状态。 原因分析 在Manager界面单独启动故障的HiveServer进程,登录后台查找hiveserver.out日志中对应时间点的报错,报错信息为:error parsing conf mapred-site.xml和Premature