检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
步骤一:创建分组规则 创建一个分组规则,当产生AOM的紧急、重要告警时,触发“Monitor_host”行动规则,且告警按照告警源合并分组。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警降噪”。 在“分组规则”页签下单击 “创建分组规则”,设置规则名称、分组条件等信息。
自建机器可以通过直接访问VPC终端节点VPC-EP的IP,访问VPC-EP对接的域名,也可以通过在机器上配置域名解析,通过接口访问AOM服务。以下通过配置域名解析为例访问AOM服务。 以Centos为例在自建机器中执行以下命令。 sudo vi /etc/hosts 配置域名解析。例如,新增配置: 192.168.0
容器的标准输出日志支持多行采集。 5.12.130 支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。 支持LTS的podlb域名的切换能力。 5.12.111 新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 5.12.100 上报内存指标增加内存workin
统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期次数须大于等于满足触发条件次数。 触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期次数最小值为1,最大值为10。 高级设置 统计周期 条件表达式查询的频率可以设置为: 每小时:表示整点小时查询。
0个时,请删除不需要的静态阈值模板后重新创建。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”。 在“静态阈值模板”页签下,单击“创建静态阈值模板”。 自定义静态阈值模板。 输入模板名称,选择资源类型,设置指标名称、统计方式、阈值条件等参数。 统计方式:指标数据按照所设置的统计方式进行聚合。
鼠标悬浮在代理区域名称上,单击选择“编辑”。 在弹出的对话框中,输入新名称,选择网络类型,单击“确定”,修改成功。 删除代理区域 用户可删除不再使用的代理区域,具体操作如下: 在左侧导航栏中,选择“采集设置 > 代理区域管理”,进入代理区域管理页面。 鼠标悬浮在代理区域名称上,单击选择“删除”。
方式需要从“指标浏览”界面跳转后填充。 具体操作:在左侧导航栏中选择“监控 > 指标浏览”。单击“添加指标查询”,通过“按指标维度添加”或“按资源添加”方式在资源树上选择一个或多个(最多可选12个)关注的指标。选择指标后,在“操作”列中单击,系统自动跳转到阈值规则的创建界面,并自
登录云容器引擎控制台(旧版)。 左侧导航栏选择“资源管理 > 网络管理”,在Service页面获取Grafana服务的访问地址和端口,以及Prometheus服务的访问域名和端口。 左侧导航栏选择“配置中心 > 配置项”,在配置项页面找到grafana-conf配置项,单击“编辑YAML”,将"root_url"修改成Grafana的访问地址。
region_name为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同,您可以从地区和终端节点中获取。例如AOM服务在“华北-北京一”区域名称为“cn-north-1”。 Site domain name suffix 为站点域名后缀,例如“myhuaweicloud.com”。
查看需要关注的事件,监控系统运行情况。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。 单击“事件”页签,查看事件信息。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如
应用与组件,在右侧搜索框中输入关键词进行搜索。 查看 您可以在“日志接入”界面查看已创建的接入配置。单击“所属日志组”列的日志组名称,可以跳转到LTS控制台的日志组详情。 编辑 在“日志接入”界面,单击“操作”列的“编辑”,可以编辑该接入配置。 删除 在“日志接入”界面,单击“操
<td><div>账号:kaifatest;<br>通知类型:告警;<br>CAS应用名称: app-1;<br>告警类型:NA;<br>事件级别:紧急;<br>事件名称:lhy_test_001;<br>发生时间:2022-11-22 18:51:05 GMT+08:00;<br>事件源
insecure_skip_verify: true bearer_token: 'SE**iH' 检查内网域名配置。 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过Grafana查
值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图6 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表3。 表3
单击“购买终端节点”。 在购买终端节点页面,选择终端节点所在的区域,“服务类别”选择“云服务”,在“选择服务”下方查找并选择AOM的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置,更多操作请参考购买终端节点。 设置完成后,单击“立即购买”。购买成功后,即可完成AOM终端节点的创建。
值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。具体参数说明请参见表2。
单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、企业项目、区域、应用环境。 单击“名称/ID”列的某个ID,展示“RDS实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。
请参见分组规则。 图4 设置告警降噪方式 单击“立即创建”,完成创建。如下图所示,创建了一条事件类告警规则。 该规则监控对象为AOM服务的紧急告警事件,当服务事件满足已设的通知策略时,系统就会以邮件、短信等方式发送告警通知给指定人员。 图5 事件类告警规则 更多事件类告警规则操作
如图1所示,即可接入DCS服务与标签。 图1 接入云服务和标签 步骤三:告警添加标签 验证云服务指标与标签是否接入。 在左侧导航栏中选择“指标浏览”。 在“指标源”页签下选择3创建的云服务类型Prometheus实例。 在“指标”下拉框中选择云服务中需要监控的指标,并在“条件”下拉框中选择步骤一添加的标签
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当Linux系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 登录AOM控制台,在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“集群:xxx”或“其他:用户自定义接入主机”。