检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
功能总览 功能总览 全部 应用运维管理 接入中心 仪表盘 告警管理 指标浏览 日志分析(新版) 日志分析(旧版) 应用洞察(日落) Prometheus监控 业务监控(BETA) 基础设施监控 应用监控 智能洞察(BETA) 自动化运维(日落) 设置 APM配置 应用运维管理 应用运维管理(Application
新增变量 通过新增变量可在仪表盘页面查看或新增图表时,自定义添加过滤器。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“仪表盘”。 选择待操作的仪表盘,在对应“仪表盘”页面右上角单击,进入“变量设置”页面。 单击“新增变量”,参考表1设置相关参数。 表1 新增变量填写说明
个IAM用户被授予的策略中必须包含允许“aom:metric:get”的授权项,该接口才能调用成功。 支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下:
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
租户从IAM申请到的projectid,一般为32位字符串。 表4 EventModel 参数 参数类型 描述 id String 事件或者告警id,系统自动生成。 starts_at Long 事件或者告警产生的时间,CST毫秒级时间戳。 ends_at Long 事件或者告警清除的时间,CST毫秒级时间戳,为0时表示未删除。
概述 AOM提供告警行动规则定制功能,,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。
attach_rule 否 Map<String,Object> 事件或者告警预留字段,为空。 id 否 String 事件或者告警id,系统会自动生成,上报无须填写该字段。 响应参数 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code String
格式,key通常设置为“aom_monitor_level”,value的设置说明如下: 全量指标为基础设施层指标:infrastructure 全量指标为中间件指标:middleware 全量指标为应用层指标:application 全量指标为业务层指标:business 设置
按照以下搜索方式搜索原始日志: 在页面搜索区域,输入待搜索的关键字,或在弹出的下拉框中选择待搜索的关键字,单击“查询”搜索。 设置日志结构化后,下拉框会同步显示系统内置字段和结构化配置的字段。 内置字段有appName、category、clusterId、clusterName、collectTim
cce_gpu_graphics_clock gpu图形处理器频率 cce_gpu_video_clock gpu视频处理器频率 cce_gpu_temperature gpu温度 cce_gpu_power_usage gpu功率 cce_gpu_total_energy_consumption gpu总能耗
加密保护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史纪录收集,以免泄露隐私。安装后ICAgent会加密存储您的AK/SK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的
配置虚机日志采集路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径。 前提条件 您需先为您的虚机安装ICAgent。ICAgent安装成功后,大概需要5分钟,您即可在“日志分析
异常 异常监控项是对应用的异常日志进行监控,比如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“
> 账单管理”查看资源的费用账单,以了解该资源在某个时间段的使用量和计费信息。 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,应用运维管理的按需计费模式按天进行结算。具体扣费规则可以参考按需产品周期结算说明。
子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
为什么购买的资源在“资源管理”界面看不到? “我的资源”已经释放删除了,为什么还会在界面展示? 为什么CMDB资源管理已经看到资源了,绑定环境的时候找不到资源? 搜索应用时,系统提示“AOM.11007006: get policy list failed.”
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”
设置主机展示列 单击主机列表右上角的按钮,可对已接入的主机展示列进行设置。 切换排序 在主机列表的表头,单击“服务器名称/ID”、“运行状态”、“操作系统”,或者“UniAgent 状态”列的可切换排序。为默认排序,为按正序排序,为按倒序排序。 父主题: UniAgent 安装与配置(新版)
全屏模式在线时长优先级高于系统在线超时退出机制。 例如,登录控制台后,打开了AOM全屏界面并设置在线时长为2小时,同时打开了AOM全屏界面外的其他任意界面,则对于其他任意界面该设置也同时生效,即2小时后自动退出到登录界面。 当所有全屏界面都退出后,则恢复系统在线超时退出机制。 例如