正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus实例 for 云服务 云服务Prometheus实例类型,适合监控云服务的多种指标。 注意事项 一个企业项目下仅可以创建一个云服务类型的Prometheus实例。 创建云服务Prometheus实例 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
云服务授权您可以为当前用户一键授予云服务数据的访问权限;通过认证管理您可以创建AccessCode并为当前用户配置API服务的调用权限;通过全局开关您可以控制指标采集开关和告警消息内容显示资源的TMS标签开关;通过数据订阅您可以订阅指标或者告警信息;通过日志设置您可以设置配额、配
AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。同时,AOM开放统一API,支撑对接自研监控系统或者报
单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。 单击“Profiler性能分析”,切换至Profiler性能分析页签。 单击“快照列表”,进入快照列表页面。 在Profiler页签选择您想要查看的实例,可以查看该实例对应的性能分析数据。 图1 快照列表 表1
其他相关操作 在虚机接入中,您可以对已创建的UniAgent的主机进行其他相关操作,具体的操作有: 表1 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过主机IP、导入IP、主机名称、安装机名称和代理IP来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
日志管理界面作为日志功能的概览页面,主要包含日志管理、日志搜索与分析、日志加工功能。 日志接入 日志接入支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式。 日志转储 通过日志转储功能,可以将日志转储至其他云服务中进行长期保存。 日志加工 提供DSL加工、定时SQL、函数加工和生成指标的功能。
其他相关操作 在UniAgent 安装与配置页面中您可以对安装UniAgent的主机进行其他相关操作,具体的操作有: 表1 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过服务器ID,服务器名称,运行状态来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
通常来源于事务监控或上报的自定义指标。 URL的调用次数、URL的最大并发数、URL的最大响应时间等 应用层指标 通常来源于组件性能图表或接口性能数据。 接口调用次数、请求平均时延、错误调用次数、请求吞吐量等 接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等
日志搜索与分析(默认推荐) 日志搜索与分析(管道符方式-邀测) 日志应用 日志接入 日志接入功能支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。 在左侧导航栏选择“日志分析
添加自定义标签字段 添加自定义标签字功能目前仅在华东-上海一开放。 通过添加自定义标签,用户可以在日志页面上查看到自定义标签,如果将aom日志接入lts后,可以通过该自定义标签关键字进行日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadat
指标名称 指标的名称。可以选择所选Prometheus实例下的指标。 展示字段 展示字段显示在仪表盘过滤框里。 值字段 展示字段对应的值。 条件 维度名称与维度值。通过AND可为同一指标设置多个条件。 多数值 是否允许多数值。默认关闭,开启后自定义的过滤器中可以选择多个数值。 包括“全选”
原因。 图2 应用服务整体错误率突增 TopN接口平均响应时间突增:基于应用的调用链数据,针对接口粒度提供调用链响应时间分析,快速定位根因。 图3 TopN接口平均响应时间突增 TopN接口错误率突增:基于应用的调用链数据,针对接口粒度提供调用链错误率分析,快速定位根因。单击“查
了常用中间件exporter接入操作指导,由于AOM兼容原生Prometheus,所以您也可以安装社区其他的Exporter。 操作方式 如果您所使用的基础组件还没有提供相应的集成方式,可以参考如下方式进行集成,以及自定义监控大屏来满足相应的监控需求。 开源社区Exporter列表。
在主机列表中,可对主机的UniAgent进行重装、升级、卸载和删除操作。 重装UniAgent 当主机的UniAgent状态为异常、安装失败或未安装时,您可以对主机进行重装UniAgent。 登录AOM 2.0控制台。 在左侧导航栏选择“设置 > 采集设置 > UniAgent 安装与配置”。 在UniAgent
插件创建完成后,您可以对自定义插件进行编辑插件、为插件创建新版本和删除插件等操作。 表3 相关操作 操作 说明 查看插件状态 选择待操作的插件,鼠标悬浮选显示,选择“版本”。在弹出页面中查看插件状态。 未上线:当新建插件或创建新版本插件时,插件状态为“未上线”;单击版本号可以编辑插件信息。
了常用中间件exporter接入操作指导,由于AOM兼容原生Prometheus,所以您也可以安装社区其他的Exporter。 操作方式 如果您所使用的基础组件还没有提供相应的集成方式,可以参考如下方式进行集成,以及自定义监控大屏来满足相应的监控需求。 开源社区Exporter列表。
500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标 10个 100个 500个 查询指标数据API调用 50万次/月 100万次/月 500万次/月 事件和告警总条数 5万条/月,存储时长7天 10万条/月,存储时长30天 50万条/月,存储时长30天
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态