检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。 父主题: 指标总览
告警故障已经解除时可进行清除操作。 被清除的告警后续可在“历史告警”页签下查询。 查看告警详情 鼠标放在目标告警所在列中的“告警详情”可查看告警详情。 - 父主题: 告警管理
、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。 约束与限制 如需使用“自动化运维”功能,需提前在“菜单开关”中开启自动化运维的开关,详细操作请参见菜单开关。 功能说明 表1 自动化运维功能说明 类别
据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
您需切换区域后分别进行开通操作。 操作步骤如下: 登录华为云管理控制台。 在左上角单击,在下拉列表中选择操作区域。 单击左侧,选择“管理与监管 > 应用运维管理 AOM”,进入AOM服务页面。 在弹出的对话框中单击“免费开通”,即可免费开通AOM。 切换版本 AOM提供基础版和
使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。 cat
0控制台会自动跳转到AOM 2.0控制台。如果需要回到AOM 1.0控制台,可以在AOM 2.0控制台左侧导航栏中单击“返回旧版”。 图4 迁移完成 父主题: 迁移AOM 1.0数据至AOM 2.0
您可以为主机组安装Node Exporter并配置采集任务,采集到的指标会存储在ECS类型Prometheus实例中,方便您管理。 约束与限制 一个主机只能安装一个Node Exporter插件。 前提条件 已接入ECS类型Prometheus监控,详情请参见创建ECS Prometheus实例。
annotations.key2 表3 配置日志消息模板参数 参数名称 说明 校验规则 样例 主题 消息的主题 支持自定义主题名称和使用变量命名主题两种方式。主题名称长度不能超过512个字符。 仅邮件类型支持配置消息主题。 test 正文 消息的内容 添加变量: 规则原始名称:${event_name}
示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。 约束与限制 每个组件最多可以创建五个标签。 标签键值长度不超过36个字符,标签值长度不超过43个字符。 标签的值只能包含大写字母、小写字母、数字和特殊符号(-_)。
审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。 通过选择“主题”的方式配置审批人,您需要在消息通知服务中,创建一个新主题,并为这个主题添加订阅。 单击“保存”完成创建。 执行安装/卸载任务 文件包创建完成后,您可以在文件列表页面对文件执
subapplication.name 子应用名称 否 - aom.component.name 组件名称。 否 与工作负载名称一致 aom.environment.name 环境名称。 否 与集群名称一致 图4 设置参数 设置完成后,单击“确定”,保存修改结果。 (可选)在“编辑YAML”窗
仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中,选择“采集设置 > UniAgent 安装与配置”。当前仅华南-广州区域的菜单路径为“采集设置 > UniAgent管理”。 勾选一个或多个待操作插件的服务器前的复选框,单击“插件批量操作”。
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。
er的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka Exporter告警接入等操作。 约束与限制 为了方便安装管理Exporter,推荐使用云容器引擎 CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群并已安装Kafka。
出而退出,无法实时进行监控。为满足您的多样化需求,AOM支持您自定义全屏模式在线时长。 约束与限制 为提高安全性,请在不需要使用全屏模式进行监控时,及时退出全屏模式。 全屏模式在线时长与是否操作无关,只要超过已设时长,则退出到登录界面。 全屏模式在线时长优先级高于系统在线超时退出机制。
指标数据,全面还原用户的体验感受,定位访问慢的原因。 定位应用性能瓶颈 业务痛点 随着业务不断发展,业务逻辑日益复杂,导致应用性能问题分析与定位日益艰难,给监控运维带来了巨大的挑战: 应用之间的依赖关系复杂,难以梳理。 调用链路长,排查和定位群体困难。 接口调用、数据库调用关系复杂,管理难度大。
创建AOM告警抑制规则 告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则
“查看调用链”或者“查看指标”,支持查看调用链或组件指标,详情请参见查看调用链和查看组件性能指标。 单击,可获取到统计时段内的最新信息。 单击,可下载拓扑图。 父主题: 应用监控