检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理采集器底座UniAgent 业务层接入AOM 应用层接入AOM 中间件及自定义插件接入AOM 运行环境接入AOM 云服务接入AOM 开源监控系统接入AOM 管理日志接入
获取资源列表 √ √ 查询节点拓扑关系 √ √ 查询操作记录 √ √ 资源监控常用操作与系统权限 表3列出了资源监控常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表3 资源监控常用操作与系统权限的关系 操作 AOM FullAccess AOM ReadOnlyAccess
项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 策略名称 描述 类别 依赖系统权限 AOM FullAccess AOM管理员权限,拥有该权限的用户可以操作并使用AOM。 系统策略 CCE Administrator、OBS Administrator、LTS
API 使用LTS的OPEN API上报日志数据。具体操作请参见:使用API将日志接入 (LTS)。 应用性能监控APM API 使用APM的OPEN API上报应用性能监控数据。具体操作请参见:使用API将调用链接入(APM)。 Prometheus 通用实例 适合已自建了Prometheus
日志费用说明 在控制台查看不到日志怎么办? 如何处理界面“ICAgent状态”为“离线”的问题? 安装了ICAgent,但是监控不到主机是什么原因? 安装ICAgent过程中,系统提示“no crontab for root”是什么原因? AOM配置日志转储时无法选中obs桶是什么原因? Grafana无法展示内容是什么原因?
入Prometheus监控,通过Grafana大盘监控主机和Kubernetes集群的众多性能指标。 通过CCE的kube-prometheus-stack插件、自建K8s集群、ServiceMonitor、PodMonitor等多种方式采集上报指标,监控部署在CCE集群内的业务数据。
实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 仪表盘 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
s:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout: '["container_name0", "container_name1"]' 规则如下: 如果没有kubernetes.AOM.log.stdout:字段,默认采集该pod
“HOURLY”:每小时 “DAILY”:每天 “WEEKLY”:每周 “CRON”:Cron表达式 枚举值: FIXED_RATE HOURLY DAILY WEEKLY CRON promql_for String Prometheus原生监控时长。 aggregation_type
日志存储空间 500MB 400GB 1TB 主机监控 指标存储7天 100VM,指标存储时长1年 200VM,指标存储时长1年 CCI实例监控 指标存储7天 500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标
统一由LTS提供并上报话单,AOM不会双算。 不变 日志索引流量 日志存储空间 监控中心 主机监控 按需计费 基础指标免费,自定义指标收费,按照指标上报量进行计费。 CCI实例监控 按需计费 秒级监控指标数量 按需计费 自定义指标 按需计费 查询指标数据API调用 按需计费 免费
维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体
事件类告警的触发策略。 累计触发:某个监控周期内达到累计次数则触发告警行动规则。 立即触发:满足筛选条件立即产生告警。 图2 设置告警规则 设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 需要设置是否启用告警行动规则。启用后,系统根据关联SMN主题
“HOURLY”:每小时 “DAILY”:每天 “WEEKLY”:每周 “CRON”:Cron表达式 枚举值: FIXED_RATE HOURLY DAILY WEEKLY CRON promql_for String Prometheus原生监控时长。 aggregation_type
过各种角度、范围分析成本和用量的趋势及驱动因素。 企业还可以通过成本中心的“成本监控”,及时发现计划外费用,做到成本的可监控、可分析和可追溯。 详细介绍请参见通过成本分析探索成本和使用量、通过成本监控识别异常成本。 成本优化 成本控制 企业可以在成本中心的“预算管理”页面创建精细
基本概念 应用资源管理 资源监控 自动化运维 采集管理
目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击目标Prometheus实例的名称,进入该实例的详情界面。 在左侧导航栏单击“指
历史API 弹性伸缩(即将下线) 监控(即将下线)