检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
igdata/nodeagent/monitorlog/monitor.log日志,搜索Resource group info可看到资源组监控采集信息。 请联系运维人员,并发送已收集的故障日志信息。 参考信息 无。 父主题: MRS集群告警处理参考
图表区域右上角的下拉菜单,选择“定制 > GC > HMaster的GC时间” ,单击“确定”,查看该图表中“GC中回收old区所花时长”监控项的值是否连续3个检测周期大于阈值(默认阈值为5秒)。 是,执行4。 否,执行6。 图1 HMaster的GC时间 在FusionInsight
object Capability对象。 vcores, memory, .. int 数值可消耗资源属性,给该命令定义分配“单元”。 count int 单元所需的数量。 relaxlocality boolean 本地化需求优先,如果不能满足则不强制满足。 locality object
ase数据管理的最小单元。如果用户在规划表和设计rowkey不合理,请求过于集中在少量固定Region时,会导致业务压力集中在单节点,造成业务侧可感知的性能下降甚至请求失败。 HBase服务增加了MetricController实例,开启热点检测能力,能够监控每个RegionSe
查看告警来源。 在“运维 > 告警 > 阈值设置 > Kudu”,找到该告警的阈值,再对比集群KuduTserver实例的内存使用百分比监控项,和阈值对比,查看阈值超过情况,找到内存使用百分比超阈值的节点。 通过增加节点、重新规划任务等方式,处理Tserver节点内存使用百分比过高的问题,或修改阈值。
object Capability对象。 vcores, memory, .. int 数值可消耗资源属性,给该命令定义分配“单元”。 count int 单元所需的数量。 relaxlocality boolean 本地化需求优先,如果不能满足则不强制满足。 locality object
object Capability对象。 vcores, memory, .. int 数值可消耗资源属性,给该命令定义分配“单元”。 count int 单元所需的数量。 relaxlocality boolean 本地化需求优先,如果不能满足则不强制满足。 locality object
object Capability对象。 vcores, memory, .. int 数值可消耗资源属性,给该命令定义分配“单元”。 count int 单元所需的数量。 relaxlocality boolean 本地化需求优先,如果不能满足则不强制满足。 locality object
处理步骤 查看磁盘容量,清除无用文件。 在MRS集群详情页面,单击“组件管理 > HDFS”,弹出“服务状态”页面。 在“图表”区域中,通过监控项“Percentage of HDFS Capacity”查看HDFS磁盘使用率是否超过阈值(默认为80%)。 是,执行1.c。 否,执行3。
修改页面右侧的规则中的阈值,以适应当前的HDFS文件数。 HDFS文件数可以通单击“服务管理 > HDFS”,在右侧“实时”区域中单击“定制”按钮,选择“HDFS File”监控项查看。 等待5分钟后,检查本告警是否清除。 是,处理完毕。 否,执行3。 收集故障信息。 在MRS Manager界面,单击“系统设置 >
发布时间 2020-04-22 解决的问题 MRS 2.1.0.2 修复问题列表: MRS Manager nodeagent重启后不显示监控信息 长时间提交作业,manager executor进程会内存溢出 支持提交作业,manager executor可配置并发度功能 MRS
CDL支持表字段大写。 Flink写网易DDB时支持指定拆分键。 Flink支持upsertkafka监控数据写入influxdb。 Flink流读Hudi支持消息滞留时间、消息堆积时间监控。 Flink支持ignoreDelete特性。 Yarn NodeManager支持优雅退服。
应用程序通常只需要分别继承Mapper类和Reducer类,并重写其map和reduce方法来实现业务逻辑,它们组成作业的核心。 MapReduce WebUI界面 用于监控正在运行的或者历史的MapReduce作业在MapReduce框架各个阶段的细节,以及提供日志显示,帮助用户更细粒度地去开发、配置和调优作业。
MRS大数据组件 hive on tez插入数据失败问题 MRS 2.1.0.2 修复问题列表: MRS Manager nodeagent重启后不显示监控信息 长时间提交作业,manager executor进程会内存溢出 支持提交作业,manager executor可配置并发度功能 MRS
OBS包升级 JDK版本升级 解决Yarn的ResourceManager内存泄漏问题 增加对调用ECS getSecuritykey接口异常的监控 优化刷新临时AK/Sk流程 解决ResourceManager内存泄露问题 解决Hive union语句合并小文件报错问题 解决Hadoop的task任务报空间不足失败问题
UI界面排版优化。 MRS Manager操作及显示易用性优化。 MRS Manager增加大数据服务滚动重启能力。 MRS Manager新增文件句柄数量监控功能。 MRS Manager新增大数据组件发生重启事件上报功能。 MRS镜像 解决ECS VNC登录不停打印输出问题。 解决操作系统日志转储配置问题。
告警”,在告警列表中展开此告警的详细信息,记录定位信息中的进程名,单击上报的主机名并记录该主机的业务IP地址。 选择“系统 > OMS”,查看监控图表中“OMS进程Full GC时间 - 进程名”,查看Full GC时间是否大于12秒(默认)。 如果无对应图表,可单击右侧下拉三角,选择“定制”并勾选对应项,单击“确定”。
在FusionInsight Manager首页,选择“集群 > 服务 > HBase > 图表”,在“图表分类”中选择“GC”,查看GC次数和GC时间监控是否异常。 是,执行6。 否,执行9。 单击“配置”,在搜索框中搜索“GC_OPTS”,在RegionServer所在节点内存允许范围内,
在FusionInsight Manager首页,选择“集群 > 服务 > HBase > 图表”,在“图表分类”中选择“GC”,查看GC次数和GC时间监控是否异常。 是,执行6。 否,执行9。 单击“配置”,在搜索框中搜索“GC_OPTS”,在RegionServer所在节点内存允许范围内,
补丁号:MRS 1.9.0.8 发布时间:2021-02-20 修复问题列表: MRS大数据组件 增加调用ECS getSecuritykey接口异常的监控 优化临时AK/Sk流程 解决ResourceManager内存泄露问题 MRS 1.9.0.7 修复问题列表: MRS Manager 解决扩容刷新队列导致队列丢失问题