检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
统计资源消耗 通过Prometheus监控服务将指标数据上报到AOM后,即可在“资源消耗”界面查看上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for ECS Prometheus
单击按钮,选择“内置指标维度”或“自定义指标维度”,即可添加新的指标维度: 指标维度名称: 内置指标维度:包含_app、_comp和_env,分别用来标识应用、组件和环境。 自定义指标维度:输入指标维度名称。自定义指标维度名称的命名规则:长度范围为1到64个字符。
设置日志配额 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”。 在“配额设置”页签下可以查看您当前使用日志大小、存储时长。 如果在AOM中已创建日志接入LTS规则,则实际的日志存储时长以LTS中“日志管理”界面设置的“日志存储时间(天)”为准,“配置设置”界面的“日志存储时长
仪表盘监控 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例 for
身份认证与访问控制 身份认证 无论用户通过AOM控制台还是API访问AOM,都会要求访问请求方出示身份凭证,并进行身份合法性校验,同时提供登录保护和登录验证策略加固身份认证安全。AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
计费模式概述 AOM支持按需计费方式。按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
基础指标:IoTDA指标 介绍IoTDA服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 IoTDA服务监控指标 指标类别 指标 指标名称 指标含义 取值范围 单位 设备总数 iotda_device_status_onlineCount 在线设备数 统计租户在当前实例
管理主机组(新版) 主机组是为了便于分类管理、提升配置多个主机数据采集的效率,对主机进行虚拟分组的单位。您可以将多个主机加入到同一个主机组,并将该主机组关联至对应的接入规则配置中。配置接入规则时以主机组为单位下发采集配置,方便您对多台主机数据进行采集。当用户扩容主机时,只需在主机组中添加主机
OS账号 管理不同类型的系统账号,用于执行脚本和文件管理。单用户支持最多创建100个账号。 创建账号 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > OS账号”,进入账号管理页面。 单击右上角的“创建账号
创建事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择
创建静默规则 使用静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 操作步骤 用户最多可创建100条静默规则。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警降噪”。 在“静默规则”页签下单击 “创建静默规则”,设置规则名称、静默条件等信息
创建日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见
支持查看故障传播链的异常事件类型包括: 应用服务整体平均响应时间突增 TopN接口平均响应时间突增 应用服务整体错误率突增 TopN接口错误率突增 通过故障转播图谱定位根因 在事件详情页面,故障传播链将展示调用链中的故障传播图谱。
单击按钮,选择“内置指标维度”或“自定义指标维度”,即可添加新的指标维度: 指标维度名称: 内置指标维度:包含_app、_comp和_env,分别用来标识应用、组件和环境。 自定义指标维度:输入指标维度名称。自定义指标维度名称的命名规则:长度范围为1到64个字符。
curl http://localhost:9121/metrics 图3 执行命令 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。
单击按钮,选择“内置指标维度”或“自定义指标维度”,即可添加新的指标维度: 指标维度名称: 内置指标维度:包含_app、_comp和_env,分别用来标识应用、组件和环境。 自定义指标维度:输入指标维度名称。自定义指标维度名称的命名规则:长度范围为1到64个字符。
curl http://localhost:9114/metric 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。