检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
仪表盘 仪表盘功能支持导入Grafana视图吗?
Prometheus监控简介 Prometheus监控概述 功能特性 产品优势 基本概念 父主题: Prometheus监控
CCE接入 CCE(云容器引擎)接入展示您已购买的CCE集群,可以对该集群下的主机批量执行ICAgent安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群。 查看集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
批量操作UniAgent 在主机列表中,可批量对主机的UniAgent进行重装、升级、卸载和删除操作。 如果安装UniAgent的主机是Windows操作系统,则只支持对主机的UniAgent进行升级和删除操作,如需重装和卸载,需手动在主机上执行。 重装UniAgent 当主机的UniAgent
httpclient错误率由高到低排序,前10位的组件环境。 如果“应用概览”展示的指标,不在表1中,可以参见指标概览。 在“应用”和“区域”下拉框中选择需要监控的应用和区域,即可查看不同应用和区域的指标数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围:
Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 通过告警降噪清除告警风暴
用于实时采集指标、日志和应用性能数据。安装ICAgent是使用AOM的前提,否则将无法正常使用AOM。 日志 AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对应的日志存储
服务的访问控制 身份认证 无论用户通过AOM控制台还是API访问AOM,都会要求访问请求方出示身份凭证,并进行身份合法性校验,同时提供登录保护和登录验证策略加固身份认证安全。AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。
身份认证与访问控制 身份认证 无论用户通过AOM控制台还是API访问AOM,都会要求访问请求方出示身份凭证,并进行身份合法性校验,同时提供登录保护和登录验证策略加固身份认证安全。AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。
、内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS日志黑名单功能,更改容器指标来源为working_set 5.12.96 新增云资源发现类型
log日志文件中。 一次性转储类似于“日志搜索”界面的导出功能,“日志搜索”界面最多可导出5000条日志,当日志数量比较多导出功能无法满足需求时,可对指定日志进行一次性转储,操作详见添加一次性转储。 添加日志转储时,除需拥有AOM和LTS使用权限外,还需要拥有OBS Administrator权限。
组件进行监控,结合应用运维管理平台和开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。 已接入的组件会显示在采集任务页面,可以配仪表盘、告警规则。 采集任务主要有两类,分别为中间件采集任务和自定义采集任务。 中间件采集任务:使用中间件插件创建的采集任务。
前提条件 已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加日志接入页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 注意事项 如需使用“日志接入”功能,需提前在“菜单开关”
GB/s。 ≥0 字节/秒(Byte/s) 网络IO ma_container_network_receive_bytes 下行Bps 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) ma_container_network_receive_packets 下行Pps
容器工作集内存使用量 container_network_receive_bytes_total 容器网络累积接收数据总量 container_network_receive_errors_total 接收时遇到的错误累积计数 container_network_receive_packets_dropped_total
量开启、停止、删除Agent。 Agent状态说明详见下表。 状态 说明 正常 该Agent运行正常。 离线 由于网络问题导致该Agent功能异常,请检查并恢复网络。 停止 该Agent被手动停止或全局停止,请联系技术人员处理。 父主题: 应用监控
华为云根据客户等级定义了不同客户的宽限期和保留期时长。 避免和处理欠费 欠费后需要及时充值,详细操作请参见账户充值。 您可以在“费用中心 > 总览”页面设置“可用额度预警”功能,当可用额度、通用代金券和现金券的总额度低于预警阈值时,系统自动发送短信和邮件提醒。 当产生欠费后,请您及时充值使可用额度大于0。
了达到多步骤参数共享目的,可清晰的看到整个流程涉及的全部参数和用途。 OS账号 用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。 父主题: 基本概念