检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
滚失败”、“不可用”、“安装失败”、“删除失败”和“未知”状态时,关闭监控将会卸载kube-prometheus-stack插件。 通过私网接入的本地集群和附着集群,关闭监控时会检查私网接入点(开启监控时创建的VPCEP终端节点和DNS内网域名)是否有其他集群在使用,若没有则会删除此私网接入点。
为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 插件状态说明 kube-prometheus-stack和log-agent插件的状态说明如表1所示。部分状态将影响集群进行监控开启、监控配置修改和监控关闭操作,详见后续章节的约束与限制部分。 表1 插件状态说明
“删除失败”和“未知”状态时,不允许修改集群监控配置。 操作步骤 登录UCS控制台,在左侧导航栏中选择“容器智能分析”。 选择一个容器舰队或者未加入舰队的集群。 图1 选择舰队或未加入舰队的集群 单击“容器洞察 > 集群总览”页签查看已开启监控的集群,在需要修改配置的集群行单击“修改接入配置”。
为华为云集群开启监控 本章节讲述为华为云集群开启监控的操作流程。 约束与限制 华为云集群开启监控之前,有可能已经安装了kube-prometheus-stack插件,若该插件处于“安装中”、“升级中”、“删除中”和“回滚中”状态时,不允许开启监控。插件的状态说明请参见插件状态说明。
为集群开启监控 集群监控概述 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 修改监控配置 关闭监控 父主题: 容器智能分析
er-0调度到的节点上的容器存储挂载容量满足所输入的容量大小。 使用Local Storage将会在您的集群内创建monitoring命名空间(如果不存在),以及local-storage类型的PV及PVC,请保证您指定的节点上存在所输入的目录以及该目录满足所输入的容量大小。 容
er-0调度到的节点上的容器存储挂载容量满足所输入的容量大小。 使用Local Storage将会在您的集群内创建monitoring命名空间(如果不存在),以及local-storage类型的PV及PVC,请保证您指定的节点上存在所输入的目录以及该目录满足所输入的容量大小。 容
为集群开启监控 登录UCS控制台,在左侧导航栏中单击“容器智能分析”。 选择一个容器舰队或者未加入舰队的集群,并单击右上角“开启监控”按钮。 图2 选择舰队或未加入舰队的集群 选择一个本地集群。 单击“下一步:接入配置”,完成网络配置。 数据接入方式:支持选择“公网接入”和“私网接入”。
er-0调度到的节点上的容器存储挂载容量满足所输入的容量大小。 使用Local Storage将会在您的集群内创建monitoring命名空间(如果不存在),以及local-storage类型的PV及PVC,请保证您指定的节点上存在所输入的目录以及该目录满足所输入的容量大小。 容
原因分析 如果开启监控的集群在策略中心配置了拦截级别的策略规则,则可能导致开启监控失败。 处理手段 请在指定集群的策略实例中,取消针对kube-system和monitoring命名空间的拦截策略。 父主题: 容器智能分析
集群因插件资源残留开启监控失败怎么办? 问题现象 集群开启监控时,接口返回报错,报错信息中含有“release name already exists”字段。 集群开启监控请求下发成功,但是监控状态为“安装失败”或“未知”,在开启监控页面查看kube-prometheus-sta
容器洞察概述 容器洞察提供基于Kubernetes原生类型的容器监控能力,全面监控集群的健康状态和负荷程度。 支持集群、节点、工作负载的资源全景。 支持节点的资源占用、工作负载的资源消耗。 展示近一小时的CPU/内存指标。 父主题: 容器洞察
进行容器智能分析相关的操作。 本地集群和附着集群目前只支持将指标和事件上报到北京四Region的AOM 2.0和LTS服务;华为云集群目前只支持北京四、上海一Region启用容器智能分析服务。 使用流程 容器智能分析的使用流程如图1所示。 图1 容器智能分析使用流程 父主题: 容器智能分析
设置视图的时间窗。 在页面右上角处,选择时间段,或者自定义时间,并单击刷新界面。 容器智能分析仪表盘提供了预置视图,您可单击视图名称边上的“切换视图”按钮,选择需要的视图查看监控数据。系统预置视图如表1所示。 表1 预置视图 视图名称 视图参数 视图中包含的监控指标 集群视图(默认视图)
监控GPU资源 本章介绍如何在UCS控制台界面查看GPU资源的全局监控指标。 前提条件 完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。
容器智能分析 集群因插件资源残留开启监控失败怎么办? 集群因策略拦截开启监控失败怎么办? 如何修改kube-state-metrics组件的采集配置?
> 集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,此时集群已经处于容器智能分析的守护中了。 后续步骤 为集群开启监控监控后,您可以进行集群的智能可视化运维,具体操作请参见容器智能分析。 父主题: 步骤四:管理多集群生命周期
监控风险安全 容器洞察提供基于Kubernetes原生类型的容器监控能力,支持集群、节点、工作负载的资源全景,支持节点的资源占用、工作负载的资源消耗,以及近一小时的CPU/内存指标展示,全面监控集群的健康状态和负荷程度。 关于UCS监控风险安全的详细介绍,请参见容器洞察章节。 父主题:
容器智能分析 容器智能分析概述 为集群开启监控 容器洞察 健康诊断 仪表盘 父主题: 可观测性
查看集群内节点情况 如果您需要监控节点的资源使用情况,可以前往容器洞察中的节点页面查看。该页面提供了指定集群下所有节点的综合信息,以及单个节点的详细监控数据,包括CPU/内存使用率、网络流入/流出速率、磁盘读/写IO等。 功能入口 登录UCS控制台。 在左侧导航栏中选择“容器智能分析”,在“容器洞察