检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图1 选择舰队或未加入舰队的集群 单击“容器洞察 > 集群总览”页签查看已开启监控的集群,在需要关闭监控的集群行,单击“取消监控”。 在二次确认弹窗中单击“确认”,即可为集群关闭监控。 父主题: 为集群开启监控
监控GPU资源 本章介绍如何在UCS控制台界面查看GPU资源的全局监控指标。 前提条件 完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。
目前容器智能分析支持监控华为云集群、附着集群、本地集群、多云集群。在开启监控时,各个集群的参数配置存在差异,因此,本小节将分别介绍这五种集群的开启操作。 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 插件状态说明 kub
修改监控配置 集群开启监控成功后,还可以修改监控配置,网络配置、指标采集配置和事件采集配置均支持修改。 当事件采集配置从开启置为关闭,系统将会删除log-agent插件。 约束与限制 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”、“回滚中”
监控中心 访问日志 应用拓扑 父主题: 服务网格
监控风险安全 容器洞察提供基于Kubernetes原生类型的容器监控能力,支持集群、节点、工作负载的资源全景,支持节点的资源占用、工作负载的资源消耗,以及近一小时的CPU/内存指标展示,全面监控集群的健康状态和负荷程度。 关于UCS监控风险安全的详细介绍,请参见容器洞察章节。 父主题:
集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,说明集群已经处于容器智能分析的守护中了。 若集群开启监控失败,请参考常见问题处理。 父主题: 为集群开启监控
为华为云集群开启监控 本章节讲述为华为云集群开启监控的操作流程。 约束与限制 华为云集群开启监控之前,有可能已经安装了kube-prometheus-stack插件,若该插件处于“安装中”、“升级中”、“删除中”和“回滚中”状态时,不允许开启监控。插件的状态说明请参见插件状态说明。
集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,说明集群已经处于容器智能分析的守护中了。 若集群开启监控失败,请参考常见问题处理。 父主题: 为集群开启监控
集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,说明集群已经处于容器智能分析的守护中了。 若集群开启监控失败,请参考常见问题处理。 父主题: 为集群开启监控
集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,说明集群已经处于容器智能分析的守护中了。 若集群开启监控失败,请参考常见问题处理。 父主题: 为集群开启监控
为集群开启监控 集群监控概述 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 修改监控配置 关闭监控 父主题: 容器智能分析
开启多集群健康监控 您可以使用UCS的容器智能分析能力为集群开启监控,以实时监控与守护集群的健康状态。 本小节将指导您如何快速为附着集群开启监控。 前提条件 准备一个云上虚拟私有云(VPC),并将集群的第三方云厂商网络环境与该VPC连通,具体可以选用如下两种方案: 虚拟专用网络(
控制台左侧导航栏单击“返回旧版”,之后选择“告警 > 告警规则”。 单击“添加告警”,输入规则名称如“插件pod指标监控”,选择规则类型为“阈值规则”,选择监控对象为“选择资源对象”。 单击“选择资源对象”按钮,添加方式选择“按指标维度添加”,指标名称下拉选择“云服务指标”>“CCE”>“POD”>“状态”。
单击服务网格名称,进入服务网格详情页。 在左侧导航栏,单击“监控中心>访问日志”,进入访问日志详情页。 单击“请求分布”页签上,分布时间按钮,可以观测到不同时间的请求数量详情。 自定义查询时间范围不能大于31天。 单击“详细信息”页签的输入框,根据属性类型可以通过指定属性的关键字搜索、过滤,查看详情。例如:实例名称。
接呈黄色;当错误率大于10%连接呈红色。 单击拓扑中的服务节点,可以查看当前服务在所选时间内的指标数据;单击拓扑中某条连接,可以查看当前连接在所选时间内的指标数据。 自定义查询时间范围不能大于7天。 父主题: 监控中心
容器洞察概述 容器洞察提供基于Kubernetes原生类型的容器监控能力,全面监控集群的健康状态和负荷程度。 支持集群、节点、工作负载的资源全景。 支持节点的资源占用、工作负载的资源消耗。 展示近一小时的CPU/内存指标。 父主题: 容器洞察
集群因策略拦截开启监控失败怎么办? 问题现象 集群开启监控时,接口返回报错,报错信息中含有gatekeeper字段。 集群开启监控请求下发成功,但是监控状态一直显示“安装中”,超时后显示“安装失败”,前往集群中检查插件的Pod状态,Pod的事件中含有gatekeeper字段。 原因分析
集群因插件资源残留开启监控失败怎么办? 问题现象 集群开启监控时,接口返回报错,报错信息中含有“release name already exists”字段。 集群开启监控请求下发成功,但是监控状态为“安装失败”或“未知”,在开启监控页面查看kube-prometheus-sta
进入该节点的详情页面,通过切换“概览”、“Pod列表”和“监控”页签查看相应内容。 表1 节点详情页面 词条 词条描述 概览 单击节点名称,可以进入节点概览页。在这里,您可以方便地查看: 资源健康概况:包括节点状态、Pod数量以及异常事件。 节点监控:包括近1小时、近8小时、近