检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AOM监控云服务 云服务监控页面以曲线图、数字图等形式直观展示华为云各服务实例的运行状态、各个指标的使用情况等信息。当前支持在的云服务监控页面查看监控信息的云服务,包括:函数工作流 FunctionGraph、对象存储服务 OBS、弹性公网IP和带宽、弹性负载均衡 ELB、NAT网关
应用场景 提升用户体验 业务痛点 行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器
查看桶日志 桶日志是AOM提供的一种细粒度日志查询功能,您可以日志桶为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 目前对于华北-北京一、华东-上海二和华南-广州区域,桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析。
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题
中间件及自定义插件接入AOM总览 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持快捷安装Prometheus官方中间件Exporter,及自定义插件。通过为中间件及自定义插件创建采集任务,并执行插件脚本,AOM就可以对相应的中间件及自定义插件指标进行监控,结合开源G
查看应用性能指标 应用概览页面展示应用维度的指标数据,包含url调用次数、url平均响应时间、url错误率等;同时支持“购买特惠包”以及“接入应用”。 查看应用性能指标 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请
功能总览 功能总览 全部 应用运维管理 接入中心 仪表盘 告警管理 日志管理 Prometheus监控 基础设施监控 应用性能&用户体验监控 云服务监控 设置 应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的
图2 查看ICAgent的版本 节点的时间与实际不同步。 如果节点时间与实际时间相差过大,会导致ICAgent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。
关联资源 为组件创建对应环境后,即可为环境关联相关资源实例,后续可通过应用监控功能实时监控资源的使用情况。 查看资源列表 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。
AOM有哪些使用限制? 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE
约束与限制 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE Enterprise
Prometheus监控概述 Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQ
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
通过AstroCanvast自定义AOM监控数据大屏 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观
通过Profiler分析代码性能 Profiler性能分析支持自动获取应用程序运行过程中的CPU、内存、时延的使用情况。通过火焰图实时展示每一个方法的调用关系和执行率,帮助用户优化代码性能。 约束与限制 Profiler性能分析,仅针对白名单用户开放,如有需求可以通过提交工单,联系工程师为您开放此功能。
与其他服务的关系 AOM可与消息通知服务、分布式消息服务、云审计等服务配合使用。例如,通过消息通知服务您可将AOM的告警规则状态变更信息通过短信或电子邮件的方式发送给相关人员。同时AOM对接了虚拟私有云、弹性负载均衡等中间件服务,通过AOM您可对这些中间件服务进行监控。AOM还对
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
统计周期。单位为秒,例如 1小时 填“3600”,当trigger_type为“immediately”时 不填。 operator 否 String 判断条件:“>”,“<”,“=”,“>=”,“<=”,当trigger_type为“immediately”时 不填。 thresholds 否