检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
tile")或运算符(例如:"and"、"or"、"unless")作为自定义指标名称,并将该自定义指标上报到AOM时,为避免promql查询时有误,AOM会将此类指标名称默认增加前缀“aom_prom_fixed_”。例如:原始自定义指标名称为"count",会被自动转换为“a
告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 登录AOM 2.0控制台。 在左侧导航栏选择“日志分析 > 日志管理”。 单击页面右上角“返回旧版”,进入“日志搜索”页签。 搜索日志 日志文件 您可快速查看组件实例或主机的日志文件,以便定位问题。
控指标值及趋势,还可将关注的指标添加到仪表盘,对其创建阈值规则和导出监控报告等操作,以便实时查看业务及分析数据。 云服务监控 云服务监控展示华为云各服务实例的历史性能数据曲线。最长可查看近6个月内的数据,有助于用户了解实例运行状况。 日志 提供日志搜索、日志文件、日志转储、日志路径等功能。
Network等。通过Node Exporter插件将指标上报到AOM,即可在对应ECS类型的Prometheus实例的“指标管理”界面下查看指标。 前提条件 已在主机安装UniAgent,详情请参考“安装UniAgent”。 约束与限制 一个主机只能安装一个Node Exporter插件。
=> 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent
AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件JAVA应用和Node.js应用的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。 监控JAVA应用:AOM支持通过快速接入Agent来监控JAVA应用,以及为部署在CCE容器中的JAVA应用安装Agent来监控JAVA应用。
在Prometheus实例列表中,单击default类型Prometheus实例的名称,进入实例的详情界面。 在左侧导航栏中单击“仪表盘”,即可查看当前Prometheus实例下系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。
例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 告警管理 告警列表是告警和事件的管理平台。 对于重点
=> 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent
(可选)实时预览日志。单击“实时日志预览”,在实时日志预览弹框中,您可以查看实时上报的日志,实现对日志数据的快速检索与分析,具体请参见查看LTS实时日志。 单击“确定”。创建成功后,可以在“业务指标(新版)”页面查看新增的指标。 相关操作 还可以根据需要执行以下相关操作: 搜索指标:在搜索框中输入指标名称搜索指标。
在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资源使用情况。单击页面右上角的,可全屏展示资源信息。 在“告警”页签下,可查看该组件的告警详情,详情请参见查看告警。 在“事件”页签下,可查看该组件的事件详情,详情请参见查看事件。 父主题: 进程监控
在“网卡”页签下,在列表中可查看该主机网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。 在“显卡”页签下,在列表中可查看该主机显卡的基本信息,单击显卡名称,可在“监控视图”页面监控该显卡的各种指标。 在“事件”页签下,可查看该主机的事件详情,详情请参见查看事件。 在“告
单击应用名称,进入“应用详情”页面,可以查看当前应用的组件列表、主机列表、监控视图以及告警。 在“组件列表”页签下,可查看该应用的组件运行状态、资源使用情况等信息。 在“主机列表”页签下,可查看该应用的主机运行状态、资源使用情况等信息。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该应用的资
支持规则名称、描述和指标名称搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。 查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。 可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警。 查看事件 在已设的连续周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。
功能名称 说明 查看应用性能指标 应用概览页面展示应用维度的指标数据,包含url调用次数、url平均响应时间、url错误率等;同时支持“购买特惠包”以及“接入应用”。 监控组件性能指标 组件列表展示组件不同的指标监控项。AOM支持查看组件的指标监控项。 通过全局拓扑图查看应用间调用关系
CCE集群的指标管理配置完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 查看指标管理 在列表中,可查看名称、标签、命名空间、配置方式等信息,并支持按集群名称、命名空间或配置方式筛选查看。 单击“操作”列的,在弹出的对话框中查看ServiceMonitor或PodMonitor采集规则详情。
参数说明 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。 每周:在周几的某个固定时间点检查一次查询和分析结果。 固定间隔:按照固定间隔检查查询和分析结果。 说明: 检查频率可以选择