检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
事件列表展示已设时间范围内产生的事件。 告警规则 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件,以便您在第一时间发现异常并进行处理。 告警通知 AOM提供了告警通知功能,您可
查看组件基础设施监控项 基础设施功能支持通过仪表盘图表展示APM实例下的性能指标数据。例如,折线图、数字图等,帮助用户全面、深入地掌握应用性能监控数据。 约束与限制 需要提前在组件设置中配置组件与基础设施关联分析设置后,组件详情页面才会展示基础设施页签。 查看组件基础设施 登录AOM
PostgreSQL Exporter接入AOM实现指标监控 应用场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场
or_source_numRecordsInPerSecond 数据源Source端每秒输入的记录数。 条/秒 flink_taskmanager_job_task_operator_sink_numRecordsOutPerSecond 数据目的Sink端每秒输出的记录数。 条/秒
广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
UniAgent管理 下发批量安装UniAgent任务 下发批量升级UniAgent任务 查询UniAgent主机列表信息 父主题: API
场景服务提供准确、及时、一致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。 AOM产品介绍 AOM快速入门 AOM成长地图
为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM已在统一身份认证服务IAM为您创建名为“
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
Redis Exporter接入AOM实现指标监控 应用场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行
说明 隐藏/显示指标数据 选择指标后,在“操作”列中单击,可将该指标数据在当前图表中隐藏。在“操作”列中单击,可将该指标数据在当前图表中展示。或显示的是指标数据的实时状态。 为指标添加告警规则 选择指标后,在“操作”列中单击,可为该指标创建告警规则。 复制指标数据 选择指标后,在“操作”列中单击,可复制该指标数据。
查看桶日志 桶日志是AOM提供的一种细粒度日志查询功能,您可以日志桶为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 目前对于华北-北京一、华东-上海二和华南-广州区域,桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析。
集群 集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。 文档数据库DDS - 名称/ID、资源状态、实例类型、版本、企业项目、区域、应用环境、操作。 数据复制服务DRS 实时同步任务 名
变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。
ICAgent安装成功但是配置错误 ICAgent安装成功但是数据采集失败 解决方法 若ICAgent未安装成功,请重新安装ICAgent。 若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。
企业项目(Enterprise Project) 下发批量安装UniAgent任务 POST /v1/{project_id}/uniagent-console/mainview/batch-import aom:uniagentAgent:install √ x 下发批量升级UniAgent任务 POST
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
区域生效。 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控