检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 配置AOM告警规则
只要系统回显信息包含“ICAgent install success”,即表示ICAgent安装成功,ICAgent的数据采集等功能即可正常使用。 父主题: 常见使用问题
义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。 查看数据库监控,详情请参见查看l数据库监控。 父主题: 监控组件性能指标
表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
查看组件Web容器监控项 查看组件消息队列监控项 查看组件远程过程调用监控项 查看组件日志监控项 查看组件基础设施监控项 查看组件调用链监控项 父主题: 应用监控
1个区域中最多可创建1000个仪表盘。 1个仪表盘中最多可添加50个图表。 1个折线图最多支持展示200条指标数据。 1个数字图只能展示1个资源。 父主题: 仪表盘监控
在“智能洞察(BETA)”页面顶部的下拉列表中选择需要开通智能洞察的应用。 图1 选择应用 单击“立即开通”即可为当前应用开通智能洞察服务。 图2 开通智能洞察功能 父主题: 智能洞察(BETA)
告警行动规则 告警行动规则定义产生告警之后,按照规则做何种动作。包括消息发送到哪里和以什么形式发送。消息发送到哪里通过华为云服务SMN主题设置。 Prometheus实例 Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针
主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。 父主题: 指标总览
告警故障已经解除时可进行清除操作。 被清除的告警后续可在“历史告警”页签下查询。 查看告警详情 鼠标放在目标告警所在列中的“告警详情”可查看告警详情。 - 父主题: 告警管理
如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 在图表中选中某一个时间节点时,展示该时间节点下各个指标的实际数值。 父主题: 监控组件性能指标
包括: 应用服务整体平均响应时间突增 TopN接口平均响应时间突增 应用服务整体错误率突增 TopN接口错误率突增 图1 故障传播图谱 父主题: 智能洞察(BETA)
无认证:无需认证,即可访问用户侧Prometheus。 设置完成后,单击“保存”。 等待大约5分钟,即可在用户侧的自建Prometheus中查看到上报的指标数据。 父主题: Prometheus监控
为应用创建对应的日志组和日志流。创建方法请参见:创建日志组和日志流。 登录LTS控制台,通过“资源统计”功能查看Top100的日志组或日志流详细的资源统计数据。 父主题: 日志分析
批量删除阈值规则 POST /v2/{project_id}/alarm-rules/delete aom:alarmRule:delete √ × 父主题: 策略授权参考
数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题
ML”,将"url"修改成Prometheus的访问域名。 修改以上两个配置文件之后,重启grafana pod,即可查看到监控数据。 父主题: 常见使用问题
java9提示反射使用告警,后期针对java9以上版本会避免这个问题 规避措施:设置illegal-access = warn (仅提示)或者删除该选项。 父主题: 采集管理
配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图5 配置完成 父主题: Prometheus监控
设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 设置是否启用告警行动规则。启用告警行动规则后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。