检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
单击“对象分析”,进入对象分析页面。 图1 对象分析 输入类名,选择实例后,单击“确认”,展示该实例中当前字段的实时取值。包括:类型、字段名以及详情。 单击详情列的“查看详情”,页面右侧区域展示该字段的详细信息。 父主题: 通过Debugging诊断代码
ReadOnlyAccess权限的IAM用户,查询命名空间时需要登录云容器引擎 CCE的控制台,在左侧导航栏中选择“权限管理”,单击页面右上角的“添加权限”,单独进行权限设置。 单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。
、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用Web监控功能,华北-北京四区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见配置AOM菜单开关。 Web监控功能当前仅在华北-乌兰察布二零一、华北-北京一、华北-北京四、华南-广州、西南-贵阳
导致通知发送失败 为主题添加相关的订阅者,即通知的接收人(例如,邮件或短信),SMN可以实时地将告警信息以广播的方式通知这些订阅者,操作详见订阅主题。 例如,订阅者设置为该运维人员的邮箱。 创建通知规则:输入规则名称,选择通知条件,选择2中已创建的主题,根据实际选择时区/语言,输
用于并行发送到远程存储的队列中每个分片的容量 prometheus_remote_storage_shards 当前用于并行发送到远程存储的分片数 prometheus_remote_storage_shards_desired 分片队列期望基于输入样本和输出样本的比率运行的分片数 pro
认展示“全部实例”的“KafkaProducer监控”信息。 图1 查看消息队列 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用A
中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。
认展示“全部实例”的“GRPCServer监控”信息。 图1 查看远程过程调用 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AO
采集周期(秒):采集数据的周期,单位为秒(s),默认为60s,可选择10s、30s和60s。 超时时间(秒):执行采集任务的超时时间,单位为秒(s),默认为60s,可选择10s、30s和60s。超时时间必须小于等于采集周期。 执行用户:执行采集任务的用户,即所选主机的用户,默认为root,并且当前只支持root账号采集。
Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选)
告警行动规则参数说明 参数名称 说明 行动规则名称 行动规则的名称,只能由数字、字母、下划线和中划线组成,且不能以下划线、中划线开头和结尾,长度为1到100个字符。 描述 行动规则的描述。 行动规则类型 告警行动规则与SMN主题、消息模板关联的类型,请从下拉列表中选择。当前只支持“通知”类型。
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
部实例”的“HttpClient监控”信息。 图1 外部调用 在“实例名称”和“监控项”下拉列表中选择实例与监控项,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签
示“全部实例”的“Mysql数据库”信息。 图1 数据库 在下拉列表中选择想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。
HttpClient错误率由高到低排序,前10位的组件环境。 在“应用”和“区域”下拉框中选择需要监控的应用和区域,即可查看不同应用和区域的概览指标数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近
检查内网域名配置 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过通过grafana查看AOM中的指标数据中grafana查询指标数据的方法,来验证上述配置修改后数据上报是否成功。
间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,串行条件设置为“告警级别等于提示”,则符合告警级别为提示的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。