检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
UniAgent 安装与配置(新版) 安装UniAgent 管理UniAgent 批量操作其他插件 其他相关操作 父主题: 采集设置
若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警降噪”。 在“抑制规则”页签下单击 “创建抑制规则”,设置规则名称、根源告警等信息。
从作业模板中挑选1个或多个步骤组合组成执行方案。是作业模板的实例化对象。 云服务场景 云服务提供的原子化的变更场景。例如重启ECS。 标准化运维 将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标准化运维发布成服务,用户无需感知底层操作逻辑,仅输入简单的信息即可自助完成特定运维场景。
告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击 “创建抑制规则”,设置规则名称、根源告警等信息。
场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 设置
概述 AOM提供告警行动规则定制功能,您可以通过创建告警行动规则关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。告警行动规则创建成功后,可在“告警管理 > 告警降噪 > 分组规则”中“创建分组规则”关联行动规则。 创建告警行动规则 创建消息模板 父主题: 告警行动规则
规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考应用发现。 应用监控 登录AOM 2.0控制台。 在左侧导航栏中选择“基础设施监控 > 进程监控”,进入应用监控界面,查看应用列表。 在应用列表上方搜索框中设置过滤条件,可以实现应用列表过滤显示。
单击组件名称,进入“组件详情”页面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签,可查看该组件所在的主机概况。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资源使用情况。单击页面右上角的,可全屏展示资源信息。
AOM只采集挂载路径下的“.log”、“.trace”、“.out”文本日志文件。 主机扩展路径 会在原先的“卷目录/子目录”中增加一个三级目录。使用户更方便获取单个Pod输出的文件。 None:不配置拓展路径。 PodUID:Pod的ID。 PodName:Pod的名称。 PodUID/
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
概述 组件设置包括自定义设置、Agent设置以及监控项。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
”间隔。例如搜索名称包含“AOM”和“LTS”的应用或资源,可在搜索框输入“aom,lts”。 企业项目 企业项目,一个项目可以包含一个或者多个应用。 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 在菜单栏的“全部企业项目”的下拉列表中,选择企业项目。
Debugging诊断 概述 线程分析 方法分析 对象分析 父主题: 组件列表
环境标签 根据实际的使用场景,为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 新增标签 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧导航栏中选择“环境标签”。 在“新增标签”页面中,设置相关参数。
告警管理使用说明 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装UniAgent,详情请参考“安装UniAgent”,安装之后使用流程请参见图1。
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
删除。 选择实例。 单击“添加资源”,弹出选择实例页面。单个任务最多支持选择100个实例。 实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表2。 图2 选择实例 表2 选择方式说明 选择方式 说明 手动选择 输入搜索条件,在实例列表中通过搜索条件来选取实例,默认按照名称搜索。
源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明
展示,帮助用户快速分析应用健康状态。 应用监控 工作负载监控 集群监控 主机监控 指标浏览 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。