检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。 部分支持 只支持监控分析指标数据,不支持监控分析日志数据。 支持 基础设施监控
ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss
云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流
云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 约束与限制 AOM日志接入LTS功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。
多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。 AOM帮您解决 图2 一站式运维平台 应用运维管理(Application
Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。 运维自动化 提供批量磁盘清理、作业编排
些成本。详细介绍请参见使用成本单元查看成本分配。 成本分析 企业只有了解组织中哪些方面产生了成本,才能正确地控制和优化成本。成本中心支持使用“成本分析”的汇总和过滤机制可视化企业的原始成本和摊销成本,从而通过各种角度、范围分析成本和用量的趋势及驱动因素。 企业还可以通过成本中心的
查询主机安装的ICAgent信息 功能介绍 该接口用于查询集群主机或用户自定义主机安装的ICAgent信息。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/{cluster_id}/{namespace}/agents 表1 路径参数 参数 是否必选
选择某一应用,在右侧区域展示各层告警信息以及绑定当前应用的仪表盘信息。 单击“业务层”、应用层、中间件层或者基础设施层,展示对应层资源是否健康。健康时该资源层显示为绿色,当出现告警信息时,该资源层显示为红色。当出现告警信息时,单击告警信息,可查看当前告警的详细信息和处理建议信息。 仪表盘相关操作详见仪表盘监控。
的告警规则。 在左侧导航栏中选择“告警管理 > 告警规则”。 在“指标或事件”页签下单击“创建”。 设置告警规则基本信息,具体的参数说明如表2所示。 表2 基本信息填写说明 参数名称 说明 示例 规则名称 告警规则的规则名称。最多可输入256个字符,只能包含中文、字母、数字、下划
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。 本入门以业务指标监控大屏为
运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。 当前运维可观测大屏预置了基
查询指定告警行动规则详细信息 场景描述 本章以通过告警行动规则名称获取告警行动规则为例。 涉及的基本信息 通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。
的全链路、多层次、一站式运维平台。 智能运维,提供智能阈值机制,基于机器学习动态阈值告警,提升监控效率。 端侧分析,支持移动APP和Browser性能指标分析和崩溃分析等,实现应用全端掌控。 事务洞察,支持自动发现事务性能问题,智能筛选,完成根因探究。 中间件监控,无需额外安装其
单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表6。 表6 “高级设置”填写说明 参数名称 参数说明 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。 每周:在周几的某个固定时间点检查一次查询和分析结果。
和计费信息。 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,应用运维管理的按需计费模式按天进行结算。具体扣费规则可以参考按需产品周期结算说明。 例如:按天结算的云服务器在2023/06/18
单击“收起时序图”,将时序图收起。 单击下载时序图。 单击资源列表中的资源,查看资源的链路信息、异常、日志、基础设施、Profiler性能分析。 “链路信息”页签展示了资源的实例、类、状态码等信息。 “异常”页签展示了资源的异常信息,若资源无异常,则不显示异常页签。 “日志”页签详细操作与介绍请参见查看组件日志监控项。
的性能指标数据。例如,折线图、数字图等,帮助用户全面、深入地掌握应用性能监控数据。 约束与限制 需要提前在组件设置中配置组件与基础设施关联分析设置后,组件详情页面才会展示基础设施页签。 查看组件基础设施 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
、CRON。 每分钟:每分钟检查一次查询和分析结果。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。 每周:在周几的某个固定时间点检查一次查询和分析结果。 固定间隔:按照固定间隔检查查询和分析结果。 CRON:通过Cron表达式指定时