检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 统计时段 指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。 如果您使用的是新版仪表盘,设置时间的方式包括:相对时间、整点时间、自定义。
除默认模板的消息字段外,消息模板还支持用户自定义字段,需用户在上报事件告警信息时在指定参数上传该字段,具体实现参考接口文档:API事件告警,对应参数见下方消息模板告警上报结构体。 自定义字段支持以JSONPath的方式取值,示例:$event.metadata.case1、$event.metadata.case[0]
通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。 创建Prometheus 通用实例 登录AOM 2.0控制台。 左侧导航栏按照如下入口进入创建Prometheus
储及进一步分析。 设置插值方式 单击“插值方式”,将指标数据按照所设置的插值方式进行聚合。当指标图表出现断点时,AOM默认使用null(即空值)表示断点。当您需要使用指标图表做汇报或展示时,出现断点的指标图表不太美观,您可通过切换插值为0或null的方式,对缺失的指标数据进行断点插值,进而规避掉断点。
在左侧导航栏选择“App监控 > 启动性能”。 启动性能 网络请求 网络请求页面展示App监控的网络请求信息,包括该应用下App的调用次数、请求耗时、API失败率、慢请求占比、API失败率趋势图、调用平均耗时趋势图、网络请求列表以及请求状态码分布。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控
错误信息描述。 error_type String 错误类型。 trace_id String 跟踪编号。主要用于开发人员快速搜索日志,定位问题。当返回的状态码为2xx时,trace_id为空;当返回4xx的状态码时,trace_id不为空。 请求示例 获取一条告警规则ID为 “alarm_rule_id”
执行命令访问AOM的域名和端口。以访问华北-北京四区域为例,如图5所示。 curl aom-access.cn-north-4.myhuaweicloud.com:8443 图5 访问AOM的域名和端口 步骤四:自建机器通过专线访问AOM域名 自建机器可以通过直接访问VPC终端
告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警条件,直接发送告警。选择直接告警方式,需要设置通知频率和是否启用告警行动规则。 通
连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计方式:指标数据按照所设置的统计方式进行聚合。 统计周期:指标数据按照所设置的统计周期进行聚合。 选择是否发送通知:当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,选择是否发送邮件或短信通知该变动。 如需使用邮件或短信方式发送通知,请选择“是”,则
uninstall success”时,表示卸载成功。 远程卸载 除了上述登录服务器上执行uninstall.sh脚本卸载ICAgent的方式,还有类似继承安装的方式对主机进行远程卸载。 在已安装ICAgent的服务器上执行如下命令,其中x.x.x.x表示服务器IP地址。 bash /opt
置应用信息的统计条件。 设置时间范围,查看已设时间范围内应用。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近30分钟、近1小时等,可根据实际需要选择不同的时间粒度。 方式二:通过设置开始时间和结束时间,自定义时间段,最长可设置为30天。 设置信息
容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prometheus等工具进行监控,避免使用AOM的采集器监控您的业务。
单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。告警通知策略有两种方式,如图4所示,此处选择直接告警方式。 直接告警:满足告警条件,直接发送告警。选择直接告警方式,需要设置通知频率和是否启用告警行动规则。 设置发送告警通知的频率,请根据需要从下拉列表中选择。
如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。 图1 分组流程 创建分组规则 用户最多可创建100条分组规则。 在左侧导航栏中选择“告警
计费概述 通过阅读本文,您可以快速了解应用运维管理AOM 2.0的计费模式、计费项、欠费等主要计费信息。如果已知资源使用情况,需了解价格预算和计费方式选择,可前往价格计算器预算价格。 计费模式 AOM当前提供按需计费模式,按需计费是一种后付费模式,即先使用再付费,按照云服务器实际使用时长
如果系统预置的自动化运维权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。
错误信息描述。 error_type String 错误类型。 trace_id String 跟踪编号。主要用于开发人员快速搜索日志,定位问题。当返回的状态码为2xx时,trace_id为空;当返回4xx的状态码时,trace_id不为空。 请求示例 修改名称为“testaom”
在线时长参数说明 参数名称 说明 设置方式 在线时长的设置方式,包括以下两种: 自定义在线时长:自定义设置固定时长后,自动退出到登录界面。 持续在线:表示不限制,即全屏界面永远不会自动退出到登录界面,可持续在全屏模式下进行监控。 时长 全屏模式的在线时长。“设置方式”不同,时长的设置不同:
SDK概述 本文介绍了AOM服务提供的SDK语言版本,列举了最新版本SDK的获取地址。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 表1提供了AOM服务支持的SDK列表,您可以在GitHub仓库查看
查看组件消息队列监控项 消息队列监控项可以对消息队列的访问进行监控,可以监控的消息队列包含KafkaProducer等类型。 查看组件消息队列 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。