检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
批量创建AOM云服务告警规则 告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 您最多可创建150个告警模板,如果告警模板数量已达到150个,请删除不需要的告警模板后重新创建。
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
使用前必读 欢迎使用应用运维管理服务(Application Operations Management,简称AOM)。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动
管理Prometheus实例 AOM支持创建各种类型的Prometheus实例。Prometheus实例创建完成后,可在实例列表中查看Prometheus实例的名称、类型、企业项目等信息,并可根据需要修改、删除Prometheus实例。 创建Prometheus实例 登录AOM 2
管理AccessCode AccessCode是调用API的身份凭据。通过创建AccessCode可为当前用户配置API服务的调用权限。该权限设置针对整个AOM 2.0服务生效。 约束与限制 每个用户最多可创建2个AccessCode。 AccessCode删除后将无法恢复,请谨慎操作。
在CTS事件列表查看云审计事件 操作场景 用户进入云审计服务创建管理类追踪器后,系统开始记录云服务资源的操作。在创建数据类追踪器后,系统开始记录用户对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 云审计控制台对用户的操作事件日志保留7天,过期自动删除,不支持人工删除。
安装UniAgent(新版) 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。
安装UniAgent(新版) 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
与其他服务的关系 AOM可与消息通知服务、分布式消息服务、云审计等服务配合使用。例如,通过消息通知服务您可将AOM的阈值规则状态变更信息通过短信或电子邮件的方式发送给相关人员。同时AOM对接了虚拟私有云、弹性负载均衡等中间件服务,通过AOM您可对这些中间件服务进行监控。AOM还对
使用Prometheus监控ECS主机的指标 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、可靠的
策略授权参考 本章节介绍AOM策略授权场景下支持的策略授权项。 支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝某项操作。
概述 应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障
自动化运维 表1 自动化运维基本概念 术语 说明 脚本管理 支持Shell、Python、Bat、Powershell脚本语言以及单个脚本的多版本管理。 作业管理 将脚本和文件原子操作进行多步骤编排形成作业模板,用于完成特定运维自动化场景操作。例如初始化业务环境。 执行方案 从作
与其他服务的关系 AOM可与消息通知服务、分布式消息服务、云审计等服务配合使用。例如,通过消息通知服务您可将AOM的告警规则状态变更信息通过短信或电子邮件的方式发送给相关人员。同时AOM对接了虚拟私有云、弹性负载均衡等中间件服务,通过AOM您可对这些中间件服务进行监控。AOM还对
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规
阈值告警最佳实践(新版) 该功能对华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。