检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CAgent。 sh /opt/oss/servicemgr/ICAgent/bin/manual/mstop.sh sh /opt/oss/servicemgr/ICAgent/bin/manual/mstart.sh 或 sh /opt/oss/servicemgr/ICAg
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
前提条件 CCE服务已拥有CCE集群,已安装MongoDB。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将mongodb_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。 在CCE集群部署MongoDB
前提条件 CCE服务已拥有CCE集群,已安装MongoDB。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将mongodb_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。 在CCE集群部署MongoDB
CCE服务已拥有CCE集群并已安装Kafka。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将对应kafka_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。 在CCE集群部署Kafka Exporter
运行环境”与“Prometheus 云服务”面板单击需要接入的指标卡片。 选择容器指标卡片: 以选择“云容器引擎CCE”卡片为例,云容器引擎CCE在购买后集群后默认已经安装ICAgent采集器。 选择云服务监控指标卡片: 在弹出的“云服务接入”对话框中选择需要监控的云服务。例如RDS或DCS服务。 单击“确定”完成接入。
一管理。 前提条件 CCE服务已拥有CCE集群,已安装ElasticSearch。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将elasticsearch_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。
CCE服务已拥有CCE集群并已安装Kafka。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将对应kafka_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。 在CCE集群部署Kafka Exporter
ontainer、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。 标签:告警标识属性,由标签名和标签值构成,支持用户自定义。例如设置为:标签
一管理。 前提条件 CCE服务已拥有CCE集群,已安装ElasticSearch。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将elasticsearch_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。
u_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
Prometheus监控具有监控数据采集、存储、计算、展示、告警等能力。监控指标覆盖广,涵盖容器、云服务、中间件、数据库、应用以及业务等多种监控数据。本文介绍Prometheus 监控支持的主要功能。 表1 监控对象接入 功能 功能说明 创建Prometheus实例 支持创建多种类型的Promet
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_cluster_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核数。 ≥0 核(Core) CPU使用率(aom_cluster_cpu_usage) 该指标用于统计测量对象的CPU使用率。
说明: 服务下架时,需确认服务是否被定时运维场景引用,如果已被引用,需先删除被引用场景,才能下架服务,具体见警告提示框的“引用详情”。 下架后服务场景页面将不展示该卡片,并且在工具市场页面系统默认的卡片会同步下架,作业方案卡片对应的执行方案发布状态更新为未发布。 下架服务卡片后
用户侧节点时间与所在时区当前时间不一致。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。 cat /var/ICAgent/oss.icAgent.trace | grep httpsend | grep MONITOR
Exporter可供使用,具体请参见Exporter详情。 Target Prometheus探针要抓取的采集目标。采集目标暴露自身运行、业务指标,或者代理暴露监控对象的运行、业务指标。 Job 一组Target的配置集合。定义了抓取间隔,访问限制等作用于一组Target的抓取行为。 Prometheus
前提条件 CCE服务已拥有CCE集群并已安装MySQL。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将对应mysql_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。 数据库授权
前提条件 CCE服务已拥有CCE集群并已安装MySQL。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将对应mysql_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。 数据库授权