检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器智能分析概述 容器智能分析是华为云打造的新一代云原生容器运维平台,可实时监控应用及资源,采集各项指标及事件等数据以分析应用健康状态,提供全面、清晰、多维度数据可视化能力,兼容主流开源组件,并提供快捷故障定位的能力。 产品功能 容器洞察:提供基于Kubernetes原生类型的容
容器智能分析 集群因插件资源残留开启监控失败怎么办? 集群因策略拦截开启监控失败怎么办? 如何修改kube-state-metrics组件的采集配置?
容器智能分析 容器智能分析概述 为集群开启监控 容器洞察 健康诊断 仪表盘 父主题: 可观测性
容器洞察概述 查看舰队总览 查看集群情况 查看集群内节点情况 查看集群内工作负载情况 查看集群内Pod情况 查看集群内事件情况 父主题: 容器智能分析
为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 修改监控配置 关闭监控 父主题: 容器智能分析
健康诊断 概述 健康诊断是容器智能分析的一个重要功能,用于诊断集群的健康状态。开通容器智能分析后,健康诊断将基于集群的配置和kube-prometheus-stack插件上报至AOM的指标,从集群、节点、工作负载、核心插件、外部依赖的维度出发,提供全面的集群健康状态检查。同时,该
插件可以采集Kubernetes事件,并在“容器洞察 > 事件”页面进行展示。 功能入口 登录UCS控制台。 在左侧导航栏中选择“容器智能分析”,在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称,选择“事件”。 查看集群内事件详情 事件页面分为两个页签:“概览”和“
查看集群情况 查看集群情况流程 在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称跳转至单个集群的智能分析页面。本页面分为五个页签,分别为: “集群”页签:具体信息请参见查看集群详情。 “节点”页签:具体信息请参见查看集群内节点详情。 “工作负载”页签:具体信息请参见查看集群内工作负载详情。
设置查看视图的相关参数。各个视图可供设置的参数不同,请参见表1。 设置视图的时间窗。 在页面右上角处,选择时间段,或者自定义时间,并单击刷新界面。 容器智能分析仪表盘提供了预置视图,您可单击视图名称边上的“切换视图”按钮,选择需要的视图查看监控数据。系统预置视图如表1所示。 表1 预置视图 视图名称
未加入舰队集群”,查看全部未加入舰队的集群、以及集群中的节点、负载总览信息。 查看舰队内集群总览 功能入口 登录UCS控制台,在左侧导航栏中选择“容器智能分析”,选择一个容器舰队。 单击“容器洞察 > 集群总览”页签查看已开启监控的集群,列表中显示容器舰队内所有集群的CPU使用率、CPU分配率、内存分配率和使用率等指标。
置的策略规则,对集群中的容器标准输出日志、容器文件日志、节点日志及K8s事件日志进行采集与转发。 关于插件的详细说明,请参考kube-prometheus-stack插件和云原生日志采集插件章节。 目前容器智能分析支持监控华为云集群、附着集群、本地集群、多云集群。在开启监控时,各
容器洞察概述 容器洞察提供基于Kubernetes原生类型的容器监控能力,全面监控集群的健康状态和负荷程度。 支持集群、节点、工作负载的资源全景。 支持节点的资源占用、工作负载的资源消耗。 展示近一小时的CPU/内存指标。 父主题: 容器洞察
“不可用”、“安装失败”、“删除失败”和“未知”状态时,不允许修改集群监控配置。 操作步骤 登录UCS控制台,在左侧导航栏中选择“容器智能分析”。 选择一个容器舰队或者未加入舰队的集群。 图1 选择舰队或未加入舰队的集群 单击“容器洞察 > 集群总览”页签查看已开启监控的集群,在
com/kubernetes/kube-state-metrics/blob/v2.2.3/docs/cli-arguments.md 父主题: 容器智能分析
络流入/流出速率、磁盘使用率等。 页面中容器组、Pod以及实例是指同一个概念。 功能入口 登录UCS控制台。 在左侧导航栏中选择“容器智能分析”,在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称,选择“Pod”。 页面呈现了所有实例的综合信息,如需深入了解单个实例的
-prometheus-stack插件接口,插件安装未成功原因含有“resource that already exists”字段。 原因分析 kube-prometheus-stack插件存在资源残留。 处理手段 可执行如下操作进行资源残留清理,并在清理后重新开启监控。 kubectl
atekeeper字段。 原因分析 如果开启监控的集群在策略中心配置了拦截级别的策略规则,则可能导致开启监控失败。 处理手段 请在指定集群的策略实例中,取消针对kube-system和monitoring命名空间的拦截策略。 父主题: 容器智能分析
关闭监控 本章节讲述为集群关闭监控的操作流程。 约束与限制 关闭监控前,请仔细阅读以下注意事项,避免数据丢失或者相关资源继续产生费用。 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”和“回滚中”时不允许关闭监控。 kube-prometheu
本地集群如何扩容容器智能分析插件的存储磁盘? 问题描述 当容器智能分析插件(kube-prometheus-stack)所依赖的PVC存储中的磁盘写满时,prometheus-server-0 Pod的日志标准输出会出现“no space left on device”报错,此时
Agent模式占用集群资源较低,为集群提供普罗指标采集能力,但不支持基于自定义普罗语句的HPA及健康诊断功能。Server模式为集群提供普罗指标采集能力,支持基于自定义普罗语句的HPA及健康诊断功能,依赖PVC,内存消耗较大。 插件规格:如果部署模式选择“Agent模式”,插件规