检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
步骤一:安装云原生监控插件 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”。 在“插件中心”页面右侧找到云原生监控插件,单击“安装”。 建议您关注以下配置,其他配置可按需进行设置。详情请参见云原生监控插件。 本地数据存储:使用本地存储监控数据,监控数据可选择是否上报至AOM或三方监控平台。
自定义 Prometheus 格式指标接入AOM 操作场景 您可以接入自定义 Prometheus格式的指标,并支持自动上报到AOM。 前提条件 已接入ECS类型Prometheus监控,详情请参见创建ECS Prometheus实例。 已创建主机组,详情请参见管理主机组。 如需使用自定义
Prometheus数据集 前提条件 连接的数据源已创建,如何创建请参见Prometheus数据源。 创建Prometheus数据集 参考登录AstroCanvas界面中操作,登录AstroCanvas界面。 在主菜单中,选择“数据中心”。 在左侧导航栏中,选择“数据集 > 全部”。
云耀云服务器支持的操作系统监控指标(安装Agent) 功能说明 安装Agent后,您便可以查看云耀云服务器的操作系统监控指标。指标采集周期是1分钟。 操作系统监控目前支持监控的监控指标有:CPU相关监控项、CPU负载类相关监控项、内存相关监控项、磁盘相关监控项、磁盘I/O相关监控项
据仓库服务(DWS)、IoTDA。 监控云服务状态 当您购买了云服务后,无需额外安装其他插件,即可在“监控>云服务监控”界面监控这些云服务的运行状态、查看其基本信息。 图1 监控云服务状态 监控云服务指标 单击云服务列表中的名称,进入云服务监控详细页面。此时您可以直接查看云服务各指标的数据曲线。
概览 主机监控分为基础监控、操作系统监控和进程监控。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见云产品监控指标。BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用
使用PrometheusRules配置普罗监控与告警规则 Prometheus具有PrometheusRule的能力,PrometheusRules提供了一种用于监控和警报的规则语言,能够方便用户更好的使用Prometheus查询监控指标,配置基于PromQL的告警规则。 当前云原生监控插件仅支持开启本地
查看监控指标 操作场景 公有云平台提供的云监控,可以对云耀云服务器的运行状态进行日常监控。您可以通过管理控制台,直观地查看云耀云服务器的各项监控指标。 前提条件 云耀云服务器正常运行。 关机、故障、删除状态的云耀云服务器,无法在云监控中查看其监控指标。当云耀云服务器再次启动或恢复后,即可正常查看。
lArts的监控数据。 前提条件 已安装Grafana。 配置Grafana数据源 获取Grafana数据源配置代码。 进入AOM管理控制台。 图1 AOM管理控制台 在左侧导航栏中选择“Prometheus监控 > 实例列表”,在实例列表中单击“Prometheus_AOM_Default”实例。
存活探针(liveness probe) 存活探针 Kubernetes提供了自愈的能力,具体就是能感知到容器崩溃,然后能够重启这个容器。但是有时候例如Java程序内存泄漏了,程序无法正常工作,但是JVM进程却是一直运行的,对于这种应用本身业务出了问题的情况,kubernetes提供了liveness
口”,访问Prometheus。 图1 访问Prometheus 单击“Status > Targets”,可以查看到Prometheus监控了哪些目标。 图2 查看监控目标 监控GPU指标 创建一个使用GPU的工作负载,等工作负载正常运行后,访问Prometheus,在“Graph”页面中,查看GPU指标。
通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击CCE类型的Prometheus实例名称,进入该实例的详情界面。
监控 使用Prometheus监控多个集群 使用dcgm-exporter监控GPU指标 将Prometheus监控数据上报至第三方监控平台 通过PromQL语句查询Prometheus数据
查看监控数据 以上配置完成后,进入控制台界面,选择“云监控”,在左侧导航栏选择“主机监控 > 裸金属服务器”,列表展示该裸金属服务器的名称/ID、主机状态、插件状态等信息。 图1 主机监控 您可以单击“操作”列的“查看监控指标”,获取裸金属服务器可视化监控图表,了解这台裸金属服务器的CPU、CPU负载、内存等指标。
监控 监控云耀云服务器 云耀云服务器支持的基础监控指标 云耀云服务器支持的操作系统监控指标(安装Agent) 云耀云服务器支持的操作系统监控指标(安装Agent,简洁版) 设置告警规则 查看监控指标
关闭监控 本章节讲述为集群关闭监控的操作流程。 约束与限制 关闭监控前,请仔细阅读以下注意事项,避免数据丢失或者相关资源继续产生费用。 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”和“回滚中”时不允许关闭监控。 kube-prometheu
查看监控指标 操作场景 当您的裸金属服务器安装了CES主机监控Agent后,可以获得裸金属服务器的各项指标监控。您可以通过管理控制台,直观地查看裸金属服务器的各项监控指标。 由于监控数据的获取与传输会花费一定时间,因此,如果您的裸金属服务器刚刚完成CES主机监控Agent安装,请等待5~10分钟后查看监控数据。
容器监控 容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进程状况、应用性能(错误数、请求数、平均响应时间)、告警分布等核心指标。同时监控主机、进程、容器、云服务、性能监控、日志分析等信息。 图2 环境监控 约束与限制 如需使用“应用监控”功能,需提