检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见:管理Prometheus实例。 将原生Prometheus的指标通过Remote Write地址上报到AOM服务端。具体请参见:将Prometheus的数据上报到AOM。 父主题: Prometheus监控
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
接入日志(LTS)简介:AOM提供业务层的日志接入LTS的入口。通过业务层卡片的“接入日志(LTS)简介”链接,查看业务层日志接入LTS的相关操作文档。您可以根据文档完成日志接入LTS相关操作。 接入调用链(APM):AOM提供业务层的调用链接入APM的入口。通过业务层卡片的“接入调用链(APM)”链接,可快速接入业务层调用链。
运行环境”类型中单击需要接入的卡片,参考下表执行相关接入操作。 表1 Prometheus 运行环境接入AOM 卡片 相关操作 云容器引擎 CCE (ICAgent) 通过ICAgent插件采集CCE集群指标。云容器引擎CCE在购买后集群和节点后默认已经安装ICAgent,自动将CCE集群指标上报到AOM,用户无需手动接入。
字母开头。 主机 单击“添加主机”,在“添加主机”页面中选择用于配置采集任务和安装Exporter的主机: 可通过主机名称、IP地址和Agent状态搜索选择主机。 可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。
接入日志(LTS)简介:AOM提供组件层日志接入LTS的入口。通过业务层卡片的“接入日志(LTS)简介”链接,查看组件层日志接入LTS的相关操作文档。您可以根据文档完成日志接入LTS相关操作。 接入调用链(APM):AOM提供组件层调用链接入APM的入口。通过业务层卡片的“接入调用链(APM)”链接,可快速接入组件层调用链。
账号欠费:客户欠费后,为防止相关资源不被停止或者释放,需要客户及时进行充值,详细说明请参见:欠费还款。 账号冻结或受限:云服务资源因欠费冻结或受限时,若处于保留期,用户可通过续费或充值来解冻该资源,恢复云服务正常使用,详细说明请参见:资源冻结。 父主题: 应用资源管理(即将下线)
AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK? 日志费用说明 在控制台查看不到日志怎么办? 如何处理界面“ICAgent状态”为“离线”的问题? 安装了ICAgent,但是监控不到主机是什么原因?
架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 AOM提供基础运维能力,APM是对AOM运维能力的补充。AOM界面集成了APM,可通过AOM界面统一运维;APM也有独立的控制台入口,可以单独使用APM。 图1 立体化运维解决方案 父主题: 其他常见问题
ey和value只能包含中文、字母、数字和下划线。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 如您的组织已经设定AOM服务的相关标签策略,则
删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件或告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过告警规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则 修改告警行动规则 获取告警行动规则列表 查询指标类或者事件类告警规则列表
单击“组件”列,某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“调用链”,切换至调用链页签,页面展示该组件调用链详情。 图1 调用链 通过选择实例、URL等查询条件查询,也可在界面下方新增自定义查询条件来查看调用链详情。详情请参考查看调用链。 父主题: 监控组件性能指标
Agent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。 父主题: 常见使用问题
新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 5.12.100 上报内存指标增加内存workingset使用量、内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS
一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(
数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提
可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。 查看URL监控,详情请参见查看URL监控。
可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。 查看Http
监控(磁盘)等多种数据信息卡片,下面分别介绍各卡片内容及操作: 基础设施监控卡片 图1 基础设施监控 此卡片主要展示基础设施的指标数据。可通过选择集群,呈现某一个集群或者所有集群中的信息。如图选择所有集群,即该基础设施监控卡片呈现所有集群的如下信息: 主机运行状态,CPU、物理内存的使用量。
AOM支持在Prometheus实例的“接入账号”中将同一组织下多个成员账号接入AOM后,实现对同一组织下多个成员账号的云服务指标进行监控。通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息。 当前仅多账号聚合实例类型Prometheus实例支持。 指标管理