检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器智能分析 集群因插件资源残留开启监控失败怎么办? 集群因策略拦截开启监控失败怎么办? 如何修改kube-state-metrics组件的采集配置?
容器智能分析 容器智能分析概述 为集群开启监控 容器洞察 健康诊断 仪表盘 父主题: 可观测性
容器洞察 容器洞察概述 查看舰队总览 查看集群情况 查看集群内节点情况 查看集群内工作负载情况 查看集群内Pod情况 查看集群内事件情况 父主题: 容器智能分析
容器智能分析概述 容器智能分析是华为云打造的新一代云原生容器运维平台,可实时监控应用及资源,采集各项指标及事件等数据以分析应用健康状态,提供全面、清晰、多维度数据可视化能力,兼容主流开源组件,并提供快捷故障定位的能力。 产品功能 容器洞察:提供基于Kubernetes原生类型的容器监控能力
帮助您快速识别系统资源占用情况。 说明: 您可以将鼠标悬停在图表上,以便查看每分钟的监控数据。 资源统计 资源统计涵盖了该舰队下CPU用量Top5集群、内存用量Top5集群、节点数量Top5集群以及Pod数量Top5集群等参数统计。
在左侧导航栏中选择“容器智能分析”,在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称,选择“Pod”。 页面呈现了所有实例的综合信息,如需深入了解单个实例的监控情况,可单击实例名称,进入该实例的“概览”页面,通过切换“容器列表”、“监控”页签查看相应内容。
仪表盘 仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图等,进而全面、深入地掌握监控数据。 查看/切换视图 选择一个容器舰队或者未加入舰队的集群。 图1 选择舰队或未加入舰队的集群 选择“仪表盘”页签,默认展示集群视图。 设置查看视图的相关参数
问题描述 kube-prometheus-stack插件的kube-state-metrics组件负责将Prometheus的metrics数据格式转换成K8s API接口能识别的格式。
容器洞察概述 容器洞察提供基于Kubernetes原生类型的容器监控能力,全面监控集群的健康状态和负荷程度。 支持集群、节点、工作负载的资源全景。 支持节点的资源占用、工作负载的资源消耗。 展示近一小时的CPU/内存指标。 父主题: 容器洞察
目前容器智能分析支持监控华为云集群、附着集群、本地集群、多云集群。在开启监控时,各个集群的参数配置存在差异,因此,本小节将分别介绍这五种集群的开启操作。
查看集群内事件情况 Kubernetes事件涵盖了集群的运行状态和各类资源的调度情况,对运维人员日常观察资源的变更以及定位问题均有帮助。如果您需要监控集群内事件,可以前往“容器洞察 > 事件”页面查看。为了实现这一目标,您需要为集群安装log-agent插件,该插件可以采集Kubernetes
查看集群情况 查看集群情况流程 在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称跳转至单个集群的智能分析页面。本页面分为五个页签,分别为: “集群”页签:具体信息请参见查看集群详情。 “节点”页签:具体信息请参见查看集群内节点详情。 “工作负载”页签:具体信息请参见查看集群内工作负载详情
等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,说明集群已经处于容器智能分析的守护中了。 若集群开启监控失败,请参考常见问题处理。 父主题: 为集群开启监控
本地集群如何扩容容器智能分析插件的存储磁盘? 问题描述 当容器智能分析插件(kube-prometheus-stack)所依赖的PVC存储中的磁盘写满时,prometheus-server-0 Pod的日志标准输出会出现“no space left on device”报错,此时普罗无法正常工作
健康诊断 概述 健康诊断是容器智能分析的一个重要功能,用于诊断集群的健康状态。开通容器智能分析后,健康诊断将基于集群的配置和kube-prometheus-stack插件上报至AOM的指标,从集群、节点、工作负载、核心插件、外部依赖的维度出发,提供全面的集群健康状态检查。同时,该功能还基于
修改监控配置 集群开启监控成功后,还可以修改监控配置,网络配置、指标采集配置和事件采集配置均支持修改。 当事件采集配置从开启置为关闭,系统将会删除log-agent插件。 约束与限制 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”、“回滚中”、
原因分析 如果开启监控的集群在策略中心配置了拦截级别的策略规则,则可能导致开启监控失败。 处理手段 请在指定集群的策略实例中,取消针对kube-system和monitoring命名空间的拦截策略。 父主题: 容器智能分析
为集群开启监控 集群监控概述 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 修改监控配置 关闭监控 父主题: 容器智能分析
关闭监控 本章节讲述为集群关闭监控的操作流程。 约束与限制 关闭监控前,请仔细阅读以下注意事项,避免数据丢失或者相关资源继续产生费用。 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”和“回滚中”时不允许关闭监控。 kube-prometheus-stack
集群因插件资源残留开启监控失败怎么办? 问题现象 集群开启监控时,接口返回报错,报错信息中含有“release name already exists”字段。 集群开启监控请求下发成功,但是监控状态为“安装失败”或“未知”,在开启监控页面查看kube-prometheus-stack