检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 告警管理 告警列表是告警和事件的管理平台。 对于重点资源的指标您可以创建阈值规则,当指标数据满足阈值条件时,AOM会产生阈值告警。
单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表4。 表4 “高级设置”填写说明 参数名称 参数说明 示例 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。
***.myhuaweicloud.com:8443/v1/6d6df***2ab7/58d6***c3d/push' tls_config: insecure_skip_verify: true bearer_token: 'SE**iH' 检查内网域名配置
请检查对应的参数是否符合要求。 SVCSTG.PE.4031012 Failed to verify the project ID. 请检查对应的参数是否符合要求。
图3 查看RDS安全组 检查RDS的安全组是否已开放3306端口。 图4 检查RDS端口是否开放 执行以下命令,进入解压文件夹,并在ECS服务器上配置mysql.cnf文件。
安装前请先检查是否存在python命令文件,如果不存在需要建立软链接。 操作步骤 在已安装ICAgent的服务器上执行如下命令。
请检查对应的参数是否符合要求。 SVCSTG.PE.5001203 Query error. 请联系技术支持工程师解决。 父主题: 弹性伸缩(即将下线)
project_id}/push' tls_config: insecure_skip_verify: true bearer_token: 'fVkvjOqghcIARvZZEEWhwSwxesmKz5Efsx9vxZSNGCXEffcjPxxxxxx' 检查内网域名配置
由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
解决方法: 检查360安全卫士等杀毒软件是否正在运行。 关闭360安全卫士后再进行icagent安装。 Windows下icagent采集文件类型需要手动配置采集路径*.log、 *.trace、 *.out等文本文件,不支持二进制文件、不支持Windows系统日志。
设置指标、环境、检查频率等告警条件参数。 图2 设置告警规则详细信息 根据需要设置告警标签和告警标注信息,为告警匹配分组,后续可关联告警降噪策略来发送告警通知。5.b选择的是业务层指标,所以此处标签设置为“aom_monitor_level:business”。
登录集群节点执行如下任意一种命令: curl http://{集群IP}:9121/metrics curl http://{集群任意节点私有IP}:30378/metrics 访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署
登录集群节点执行如下任意一种命令: curl http://{集群IP}:9121/metrics curl http://{集群任意节点私有IP}:30378/metrics 访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署
图9 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。告警通知策略有两种方式,如图10所示,此处选择直接告警方式。 直接告警:满足告警条件,直接发送告警。选择直接告警方式,需要设置通知频率和是否启用告警行动规则。
健康中心 集群健康诊断基于容器运维专家经验对集群健康状况进行全面检查,能够及时发现集群故障与潜在风险并给出修复建议。详情请参见健康中心。 监控中心 监控中心提供容器洞察、健康诊断、仪表盘等功能。
请检查参数。 SVCSTG.INV.5000002 The Elasticsearch execution is abnormal. 请联系技术支持工程师解决。 SVCSTG.INV.5000003 The call ICMGR is abnormal.
另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 创建仪表盘前,请您先了解仪表盘中支持添加的图表类型,以便选择合适的图表,更精准地对资源进行监控。
Checkpointing flink_jobmanager_job_lastCheckpointDuration 完成最新checkpoint所用的时间 毫秒(ms) flink_jobmanager_job_lastCheckpointSize 最新checkpoint的大小,如果启用了增量检查点或更改日志
coredns_forward_conn_cache_hits_total 每个协议和数据流的缓存命中次数 coredns_forward_conn_cache_misses_total 每个协议和数据流的缓存未命中次数 coredns_forward_healthcheck_broken_total 健康检查
另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。