检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
步骤二:将云服务接入Prometheus实例中 登录AOM 2.0控制台。 在左侧导航栏中选择“Prometheus监控 > 实例列表”。 单击“创建Prometheus实例”,设置实例名称、企业项目和实例类型信息。 “实例类型”选择“Prometheus for 云服务”。 设置完成,单击“确定”,
作业创建完成后,您可以在作业管理列表单击对应的作业名称进入该作业的详情页面,查看作业的基本信息、全局参数和作业步骤,还可执行表7中的操作。 表7 相关操作 操作 说明 编辑作业 单击右上角的“编辑”,进入编辑页面进行修改。 说明: 编辑作业后,需新建执行方案才能使用编辑后的作业数据。 选择方案 单击右上角的“选择方案”,进入作业方案列表页面。
查看基础设施 在下拉列表中选择您想要查看的APM实例,可以查看该实例下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击进行刷新,有两种方式刷新方式:手动刷新和自动刷新。
目前仅default类型、CCE类型、云服务类型、通用实例、ECS类型、APM类型的Prometheus实例支持指标查看、新增和废弃功能。 在指标管理页面仅支持查询近3个小时内上报的指标。 default类型的Prometheus实例下,指标名以“aom_”、“apm_”开头以及资源类型为ICAgent的指标暂不支持废弃。
云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。
通过日志接入和日志搜索功能帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 支持 支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持
pu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读取速率(aom_container_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s)
告警规则”,单击右上角的“添加告警”。 设置事件类告警规则。 设置告警基本信息:在“规则名称”文本框中输入告警规则名称,并根据需要填写规则的描述信息。 图1 设置告警基本信息 设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明
界面。 选择待操作的仪表盘,在对应“仪表盘”页面右上角单击。 在弹出的对话框中设置全屏模式在线时长。具体的参数说明请参见表1。 图1 设置在线时长 表1 在线时长参数说明 参数名称 说明 设置方式 在线时长的设置方式,包括以下两种: 自定义在线时长:自定义设置固定时长后,自动退出到登录界面。
变量管理 设置完成,单击“确定”。 单击“确定”,完成告警模板创建。 (可选)在弹出的“告警模板关联到Prometheus实例或集群”对话框中设置告警模板需要关联的Prometheus实例或集群,详细的参数说明请参见表5,设置完成单击“确定”。 图5 将告警模板关联到Prometheus实例或集群
对象存储服务(Object Storage Service,简称OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。 AOM支持将日志转储到OBS的桶中,以便长期存储。 云审计服务 云审计服务(Cloud
前应用的仪表盘,以图表的形式展示指标源、日志源以及系统图表信息。 组件监控 在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标
从下拉列表选择需要的Prometheus实例。此处选择4.a创建的ECS实例。 设置告警规则详情。具体的参数说明如表4所示。 设置完成后,监控的指标数据以折线图形式显示在告警条件上方。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 图3 设置告警规则详情 表4
告警规则”,单击右上角的“添加告警”。 自定义阈值规则。 设置规则的基本信息:在“规则名称”文本框中输入阈值规则名称,并根据需要填写规则的描述信息。 设置阈值规则的详细信息。 设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按
持设置此参数。 Prometheus监控 当指标或事件满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 日志监控 当日志数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 云监控 AOM 2.0控制台中创建监控数据来源为“云监控”类型的告警通知规则功能由云监控服务
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_node_cpu_usage) 该指标用于统计测量对象的CPU使用率。
不可选。 实例类型 Prometheus实例的类型,此处选择“Prometheus for 多账号聚合”。 设置完成,单击“确定”。 接入账号 登录AOM 2.0控制台。 在Prometheus实例列表中,单击多账号聚合类型的Prometheus实例名称,进入该实例的“账号接入”界面。
事件名称:根据“监控对象”设置的事件名称显示。如果在“监控对象”中未选择具体的事件名称,则此处显示为全部事件且不可选。 触发方式:事件类告警的触发方式。 累计触发:某个监控周期内,事件或者告警满足筛选条件的次数达到设置的累计次数,按照设置的频率发送对应的告警通知。频率设置为N/A时,无通知次数限制,即事件或者告警满
根据需要填写规则的描述信息。 设置规则的详细信息。 设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。
中间件:您可以直接使用AOM提供的的中间件Exporter插件来给主机创建采集任务,并安装中间件Exporter插件,即可监控中间件相关指标。AOM支持监控中间件的具体指标请参见“开源社区Exporter列表”。 表1 中间件接入AOM 卡片 相关操作 MySQL 单击“MySQL”卡片,在弹出页面接入MySQL