检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
”的计算方式时,不支持使用告警恢复功能。 例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。在告警规则详情中选
AOM最佳实践汇总 本文汇总了应用运维管理(AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
1表示未连接 无 NTP同步状态(aom_node_ntp_status) 该指标用于统计主机本地时间与NTP服务器时间是否同步。 0、1 0表示同步 1表示未同步 无 进程数量(aom_node_process_number) 该指标用于统计测量对象上的进程数量。 ≥0 无 显卡温度
上报事件或告警信息 功能介绍 该接口用于上报事件或告警至AOM,同时支持清除告警信息。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/push/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
如何获取Prometheus实例的服务地址? 用户可以登录AOM控制台,进入Prometheus实例的详情页面,获取Prometheus实例的服务地址。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。
默认值 描述 regionId 是 String 无 仪表盘当前区域ID,登录console页面后,在浏览器地址栏中获取。 id 是 String 无 仪表盘当前图表ID,从仪表盘图表页面的浏览器地址栏获取。 epsId 是 String 无 仪表盘所属的企业项目ID,从仪表盘图表页面
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。
可观测指标浏览 指标浏览展示了各资源的指标数据,您可实时观测监控的指标值及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看及分析业务数据。 监控指标 登录AOM 2.0控制台。 在左侧导航栏中选择“指标浏览”。 从下拉列表选择需要监控的Prometheus实例。 通过“
接入AOM总览 AOM提供多场景、多层次、多维度指标与日志数据的监控能力,通过旧版接入中心快速接入需要监控的指标和日志,接入完成后,即可方便地在“指标浏览”页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的日志等信息。 约束与限制 如果您进入的是新版接入中心,需要单击“
功能总览 功能总览 全部 应用运维管理 接入中心 仪表盘 告警管理 日志管理 Prometheus监控 基础设施监控 应用性能&用户体验监控 云服务监控 设置 应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
在左侧树节点选中待操作的环境,在右侧区域单击“资源列表”并选择资源类型,在资源列表中查看各个资源类型信息,参见表1。 图1 查看资源列表 资源管理界面有资源则展示该资源,无资源则不展示。 应用管理界面涉及到绑定环境的资源都会展示。 表1 资源列表 资源类型 子类型 信息 云服务器ECS - - 名称/ID、内网
查看组件基础监控项 基础监控主要针对应用的JVM信息、JVM监控、GC监控、线程、JAVA方法进行监控。 查看组件基础监控项 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
配置容器服务日志采集路径 AOM支持容器服务日志采集,并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 注意事项 ICAgent只采集*.log、*.trace和*.out类型的文本日志文件。 配置步骤 在CCE中添加日志策略 在CCE
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都