检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
M提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。 AK/SK 访问密钥。通过提供租户级别的AK/SK来安装ICAgent,以便于采集日志数据。 ICAgent
击文本框,选择对应的统计规则及其关键词,即可自动输入。同时,统计规则创建成功后,AOM会对关键词进行统计并生成指标,您可在“指标监控”页面对其进行监控。 查看搜索结果。 通过柱状图查看统计数据 柱状图展示了满足2中已设查询条件的日志条数在时间上的分布。横轴显示时间,并对横轴进行3
一站式运维平台 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AOM有哪些优势
子应用下的创建的组件数量<=50。 环境 组件下可创建的环境数量<=20。 资源 单个环境管理的同类实例资源数量<=2000。 资源监控使用限制 表2 资源监控使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表 1个仪表盘中最多可添加30个图表。
主机的操作系统满足AOM支持的操作系统(AOM支持的操作系统详见操作系统使用限制)且主机已安装ICAgent,即可将主机接入到AOM中进行监控。 ICAgent ICAgent是AOM的采集器,分别运行在每台主机上用于实时采集指标、日志和应用性能数据。安装ICAgent是使用AOM的前提,否则将无法正常使用AOM。
则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此
user_id String 用户id。 表6 MetricAlarmSpec 参数 参数类型 描述 monitor_type String 监控类型。 “all_metric”:全量指标 “promql”:PromQL “resource”:(日落)资源类型 枚举值: all_metric
用于DNS解析域名,下载UniAgent包时解析OBS地址、解析UniAgent服务端地址。 1 允许 IPv4 TCP 443 100.125.0.0/16 采集监控数据上报到AOM服务端。 父主题: 采集管理
通过cmdb树选择云服务资源执行任意任务时,会校验已选择的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,将不会操作这些资源。 解决方法 检查需要操作的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,重新选择子项目或将需要操作的资源添加到该子项目下。查看资源信息的详细操作请参考资源管理。
AOM与APM有何区别? AOM与APM同属于立体化运维解决方案体系,共享采集器。AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维
值这几个部分,采样点以时间线的方式在逻辑上组织起来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周
点获取。 例如IAM服务在“华北-北京一”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。 监控接口、日志接口和弹性伸缩接口请使用AOM的终端节点,APM接口请使用APM的终端节点,详见终端节点。 resource-path:资源路径
新为未发布。 下架服务卡片后 ,服务卡片关联的任务将不能再次执行,待卡片重新上架后,关联的任务将恢复执行功能。 “文件管理”、“脚本管理”属于默认功能,不支持下架。 通用场景 通用场景默认展现文件管理、脚本管理工具卡片,也可以根据自身需求定制相应的工具卡片。可以使用卡片快速创建任
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定:将资源对象与应用下的环境建立关联关系,在同一个应用下资源对象实例可属于多个环境。 资源解绑:关联资源后,当组件或环境信息变化,不需要资源时,可将资源从原应用节点解除绑定。 资源转移:关联资源后,当组件或环境信
“CCE” “LTS” “AOM” monitor_objects 否 Array of Map<String,String> objects 监控对象列表。键值对形式,键值为: “event_type”:通知类型 “event_severity”:告警级别 “event_name”:事件名称
本Region外:给区域外主机安装UniAgent,即给用户登录AOM服务控制台所在region区外的其他区域主机安装UniAgent。例如华为云其他region、第三方都属于区域外主机。 当前新版安装UniAgent功能在邀测中,支持华北-北京四、华东-上海一局点,仅针对用户内测使用。该功能受限开放,如有需求可以通过提交工单,为您开放此功能。
- (可用物理内存 + 可用虚拟内存)) / (物理内存容量 + 虚拟内存总量)。目前创建的虚机默认虚拟内存为0,在未配置虚拟内存的情况下,监控页面内存使用率,虚拟内存使用率相同。 物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载