-
配置监控指标数据转储 - MapReduce服务 MRS
重要指标字段说明 实时指标ID:指标的采集周期为30s/60s的指标ID,一个独立的指标项只可能存在30s或者60s的实时指标项。 5分钟指标ID:指标对应的5分钟(300s)的指标ID。 指标采集周期(秒):主要是针对实时指标的采集周期,可选值为30或60。 指标所属服务:
-
配置监控指标转储 - MapReduce服务 MRS
在“配置”区域“监控和告警配置”下,单击“监控指标转储配置”。 表1介绍转储参数。 表1 转储参数 参数名称 参数说明 是否必选 监控指标转储开关 指定是否打开监控指标数据对接功能。 :启用监控指标转储。 :禁用监控指标转储。 是 FTP IP地址 指定监控指标数据对接后存放监控文件的FTP服务器。
-
查看和定制集群监控指标 - MapReduce服务 MRS
用户同步完成后,单击“监控信息”页签,查看到集群的监控指标报表。 在时间区间选择需要查看监控数据的时间段。可供选择的选项如下: 近1小时 近3小时 近12小时 近24小时 近7天 近1个月 自定义:在时间范围内自行选择需要查看的时间。 自定义监控指标报表。 单击“定制”,勾选需要显示的监控指标。
-
ALM-12038 监控指标转储失败 - MapReduce服务 MRS
ALM-12038 监控指标转储失败 告警解释 用户在FusionInsight Manager界面配置监控指标转储后,系统按转储时间间隔(默认60秒)周期性检测监控指标转储结果,转储失败时产生该告警。 转储成功后,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 12038
-
管理监控指标数据报表 - MapReduce服务 MRS
定制”。 监控时段以5分钟为单位,显示最近1小时的监控数据;从进入“实时监控”页面后,在监控图右侧以5分钟为单位显示实时监控数据。 在窗口左侧分类中,选择一项监控资源主体。 在右侧监控列表勾选一个或多个监控指标。 图1 自定义监控指标报表 单击“确定”。 导出全部监控数据 登录FusionInsight
-
管理服务和主机监控 - MapReduce服务 MRS
管理服务和主机监控 用户可以在日常使用中,可以在MRS Manager管理所有服务(含角色实例)和主机的状态及指标信息: 状态信息,包括运行、健康、配置及角色实例状态统计。 指标信息,各服务的主要监控指标项。 导出监控指标。 用户可以选择页面自动刷新间隔的设置,也可以单击马上刷新。
-
HBase操作请求次数指标中的多级图表统计如何理解? - MapReduce服务 MRS
HBase操作请求次数指标中的多级图表统计如何理解? 问: HBase操作请求次数指标中的多级图表统计如何理解? 答: 以“RegionServer级别操作请求次数”监控项为例: 登录FusionInsight Manager,选择“集群 > 服务 > HBase > 资源”,在
-
配置监控与告警阈值 - MapReduce服务 MRS
值配置”,依据规划选择监控指标并设置其基线。 单击某一指标例如“CPU使用率”,单击“添加规则”。 在“配置”对话框中填写监控指标规则参数。 表1 监控指标规则参数 参数名 参数解释 参数值 规则名称 规则名称 CPU_MAX(举例) 参考日期 查看某指标的历史参考数据 2014/11/06(举例)
-
资源监控 - MapReduce服务 MRS
时、1天、1周、1月。单击可导出相应报表信息,无数据的监控项无法导出报表。支持资源监控的服务及监控项如表1所示。 表1 服务资源监控 服务 监控指标 说明 HDFS 资源使用(按租户) 按租户统计HDFS的资源使用情况。 可选择按“容量”或“文件对象数”观察。 资源使用(按用户)
-
管理组件和主机监控 - MapReduce服务 MRS
管理组件和主机监控 用户在日常使用中,可以在MRS管理所有组件(含角色实例)和主机的状态及指标信息: 状态信息,包括运行、健康、配置及角色实例状态统计。 指标信息,各组件的主要监控指标项。 导出监控指标(MRS 3.x及之后版本暂不支持)。 MRS 3.x之前版本操作方法请参考管理服务和主机监控。
-
ALM-12038 监控指标转储失败(2.x及以前版本) - MapReduce服务 MRS
HostName 产生告警的主机名。 对系统的影响 监控指标转储失败会影响上层管理系统无法获取到MRS Manager系统的监控指标。 可能原因 无法连接服务器。 无法访问服务器上保存路径。 上传监控指标文件失败。 处理步骤 联系运维人员查看MRS Manager系统与服务器网络连接是否正常。
-
监控安全风险 - MapReduce服务 MRS
监控安全风险 MRS的Manager界面提供集群级别的监控能力,帮助用户监控集群中大数据组件和节点的健康状态,同时提供告警通知能力,用户可以实时掌握MRS集群的各项指标、健康度。 更多详情请参见查看和定制集群监控指标和管理组件和主机监控。 父主题: 安全
-
集群运维 - MapReduce服务 MRS
集群运维 告警管理 MRS可以实时监控大数据集群,通过告警和事件可以识别系统健康状态。同时MRS也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况,当监控数据达到告警阈值,系统将会触发一条告警信息。 MRS还可以与华为云消息通知服务(SMN)的消息服务系统对接,将告警信息
-
ALM-12172 指标上报CES失败 - MapReduce服务 MRS
对系统的影响 监控指标上报CES失败,在CES中无法看到MRS云服务的监控指标。 可能原因 权限问题请求CES接口失败。 网络问题上报CES数据失败。 服务内部问题导致上报CES数据失败。 处理步骤 打开FusionInsight Manager 页面,选择“运维 > 告警 >
-
查看Flume客户端监控信息 - MapReduce服务 MRS
图1 Flume管理 选择“实例ID”,进入客户端监控列表,在“实时”区域框中,可查看客户端的各监控指标。 选择“历史”进入历史监控数据查询界面。筛选时间段,单击“查看”可显示该时间段内的监控数据。 父主题: Flume运维管理
-
管理资源分布 - MapReduce服务 MRS
线。 部分监控指标的资源分布不记录。 操作步骤 查看服务监控指标的资源分布 在MRS Manager,单击“服务管理”。 单击服务列表中指定的服务名称。 单击“资源贡献排名”。 “指标”中选择服务的关键指标,MRS Manager将显示过去1小时内指标的资源分布情况。 查看主机监控指标的资源分布
-
监控管理 - MapReduce服务 MRS
监控管理 系统概览 管理服务和主机监控 管理资源分布 配置监控指标转储 父主题: Manager操作指导(适用于2.x及之前版本)
-
查看Flume客户端监控信息 - MapReduce服务 MRS
图1 Flume管理 选择“实例ID”,进入客户端监控列表,在“实时”区域框中,可查看客户端的各监控指标。 选择“历史”进入历史监控数据查询界面。筛选时间段,单击“查看”可显示该时间段内的监控数据。 父主题: Flume运维管理
-
Kafka集群监控管理 - MapReduce服务 MRS
Kafka集群监控管理 Kafka集群监控管理包含以下内容: 查看Broker信息 查看Topic信息 查看Consumers信息 通过KafkaManager修改Topic的partition 查看Broker信息 登录KafkaManager的WebUI界面。 在集群列表页面
-
配置MRS集群阈值类告警 - MapReduce服务 MRS
略、或告警阈值可进行调整,用户也可以根据需要自定义集群监控指标,或屏蔽对应告警,使告警不再上报。 MRS集群阈值转告警监控指标可分为节点信息指标与集群服务指标,相关指标及其对系统的影响、默认阈值等信息请参考监控指标参考。 阈值类告警通常会对集群功能的正常使用、或作业的运行等有一定