检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日
维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。
约束与限制 应用资源管理使用限制 表1 应用资源管理使用限制 对象 使用限制 应用 租户创建的应用个数<=1000。 子应用 应用下创建的子应用数量<=50。 组件 子应用下的创建的组件数量<=50。 环境 组件下可创建的环境数量<=20。 资源 单个环境管理的同类实例资源数量<=2000。
约束与限制 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE Enterprise
表信息。 组件监控 在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进
源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支持创建告警行动策略。关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。 支持创建告警降噪策略。告警降噪策略分为路由分组、去重、抑制、静默四部分,作用于发送告警通知
UniAgent 安装与配置 安装UniAgent 安装UniAgent(新版) 管理UniAgent 批量操作其他插件 父主题: 采集设置
0表示正常 1表示异常 无 NTP偏移量(aom_node_ntp_offset_ms) 该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) NTP服务器状态(aom_node_ntp_server_status)
隐私与敏感信息保护声明 由于AOM会将运维数据内容展示到AOM控制台,请您在使用过程中,注意您的隐私及敏感信息数据保护,不建议将隐私或敏感数据上传到AOM,必要时请加密保护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输
与AOM 1.0对比 AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。
身份认证与访问控制 身份认证 无论用户通过AOM控制台还是API访问AOM,都会要求访问请求方出示身份凭证,并进行身份合法性校验,同时提供登录保护和登录验证策略加固身份认证安全。AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。
身份认证与访问控制 服务的访问控制 父主题: 安全
AOM与APM有何区别? AOM与APM同属于立体化运维解决方案体系,共享采集器。AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维
AOM 1.0与AOM 2.0使用对比 具有AOM 1.0的权限后,使用AOM 2.0需要单独授权吗? AOM2.0采用新计费方式,与AOM 1.0的计费方式不同,所以首次从AOM 1.0切换到AOM 2.0,还需要再单独申请AOM 2.0的操作权限,具体请参见开通AOM 2.0。
云资源与应用的开通与复制;同时在示例模板中提供了海量的免费应用模板,覆盖各热点云服务应用场景,方便您直接使用或为您设计个性化模板提供参考。 通过AOM界面您可监控RFS的基础资源和运行在其上的应用,同时在AOM界面还可查看相关的日志和告警。 应用管理与运维平台 应用管理与运维平台
云资源与应用的开通与复制;同时在示例模板中提供了海量的免费应用模板,覆盖各热点云服务应用场景,方便您直接使用或为您设计个性化模板提供参考。 通过AOM界面您可监控RFS的基础资源和运行在其上的应用,同时在AOM界面还可查看相关的日志和告警。 应用管理与运维平台 应用管理与运维平台
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
0表示正常 1表示异常 无 aom_node_ntp_offset_ms NTP偏移量 该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态
UniAgent 安装与配置”。 勾选一个或多个待重装UniAgent服务器前的复选框,然后执行如下操作: 旧版“虚机接入”页面:单击“UniAgent批量操作 > 重装”,然后在弹出的页面中,按照界面提示重新安装UniAgent。 新版“UniAgent 安装与配置”页面:在“EC