检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选)
HttpClient错误率由高到低排序,前10位的组件环境。 在“应用”和“区域”下拉框中选择需要监控的应用和区域,即可查看不同应用和区域的概览指标数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近
服务命名部分,数组中有多个对象时表示将每个对象抽取到的字符串拼接作为服务的名称。nameType取值cmdLine时args格式为["start","end"],表示抽取命令行中start、end之间的字符。nameType取值cmdLine时args格式为["aa"],表示抽取环境变量名为aa对应的环境变量值。nameType取值str时
配置Grafana数据源参数。 URL:将URL设置为3获取的HTTP URL信息。 User:将User设置为3获取的用户名信息。 Password:将Password设置为3获取的密码信息。 Auth下Basic auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置完成
可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。 单击“当前线程数”、“busy线程数”、“busy线程数峰值”等列的蓝色字体数值,可以查看所选时间段内该Web容器的趋势图。 单击“版本”列的版本信息,可以查看对应版本详情。
认展示“全部实例”的“KafkaProducer监控”信息。 图1 查看消息队列 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用A
多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,一个并行条件下设置了两个串行条件,依次为“告警级别等于紧急”、“告警源等于AOM”,则告警级别为紧急的AOM告警会被筛选出来,并根据设置的告警行动规则执行告警通知操作。
限制”、“解析业务code的key”、“业务code的正确值”参数后,会采集相应的应用码。一般情况下,应用码的值与业务code的正确值相同。配置url监控项详见:配置url监控项。 选填 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6
认展示“全部实例”的“GRPCServer监控”信息。 图1 查看远程过程调用 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AO
URL在采集周期内的平均响应时间。 url错误率 URL的错误率。 mysql错误率 MySQL的错误率。 redis错误率 Redis的错误率。“redis错误率”指标列默认不展示,可单击右上角,通过选中或取消选中“redis错误率”指标项前的单选框,自定义该列的展示与隐藏。 httpclient错误率
之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。
causeType 发生异常的类 exceptionType 异常类型 数量 该异常的发生次数 异常消息 该异常产生的异常消息 异常堆栈 该异常产生的堆栈信息 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作:
心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示: 会产生自定义指标上报的场景:接入Prometheus后,为什么会产生额外费用?。 指标存储时长
间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,串行条件设置为“告警级别等于提示”,则符合告警级别为提示的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。
ECS实例,并在AOM的接入中心安装node-exporter或自建中间件。 配置完成后,单击“保存”。 全采样设置 为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,调用链不会
告警行动规则参数说明 参数名称 说明 行动规则名称 行动规则的名称,只能由数字、字母、下划线和中划线组成,且不能以下划线、中划线开头和结尾,长度为1到100个字符。 描述 行动规则的描述。 行动规则类型 告警行动规则与SMN主题、消息模板关联的类型,请从下拉列表中选择。当前只支持“通知”类型。
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示: 会产生自定义指标上报的场景:接入Prometheus后,为什么会产生额外费用?。 0~150(百万条):0
中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
部实例”的“HttpClient监控”信息。 图1 外部调用 在“实例名称”和“监控项”下拉列表中选择实例与监控项,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签