检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改监控配置 集群开启监控成功后,还可以修改监控配置,网络配置、指标采集配置和事件采集配置均支持修改。 当事件采集配置从开启置为关闭,系统将会删除log-agent插件。 约束与限制 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”、“回滚中”
容器洞察概述 容器洞察提供基于Kubernetes原生类型的容器监控能力,全面监控集群的健康状态和负荷程度。 支持集群、节点、工作负载的资源全景。 支持节点的资源占用、工作负载的资源消耗。 展示近一小时的CPU/内存指标。 父主题: 容器洞察
监控GPU资源 本章介绍如何在UCS控制台界面查看GPU资源的全局监控指标。 前提条件 完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。
监控风险安全 容器洞察提供基于Kubernetes原生类型的容器监控能力,支持集群、节点、工作负载的资源全景,支持节点的资源占用、工作负载的资源消耗,以及近一小时的CPU/内存指标展示,全面监控集群的健康状态和负荷程度。 关于UCS监控风险安全的详细介绍,请参见容器洞察章节。 父主题:
图1 选择舰队或未加入舰队的集群 单击“容器洞察 > 集群总览”页签查看已开启监控的集群,在需要关闭监控的集群行,单击“取消监控”。 在二次确认弹窗中单击“确认”,即可为集群关闭监控。 父主题: 为集群开启监控
对接方式:当前仅支持接入AOM服务。 AOM实例:容器监控会将指标统一上报给AOM服务,因此需要选择一个Prometheus for CCE 类型的AOM实例。默认指标是免费的,而自定义指标将由AOM服务收费。收费标准请参见AOM计费说明。 采集周期:普罗采集指标数据并上报的时间周期。取值范围10~120秒,默认为15秒。
对接方式:当前仅支持接入AOM服务。 AOM实例:容器监控会将指标统一上报给AOM服务,因此需要选择一个Prometheus for CCE 类型的AOM实例。默认指标是免费的,而自定义指标将由AOM服务收费,收费标准请参见AOM计费说明。 采集周期:普罗采集指标数据并上报的时间周期。取值范围10~60秒,默认为15秒。
cs API提供资源指标。 自定义指标 安装kube-prometheus-stack。 安装插件前,请检查您的华为云集群版本,若为v1.19以下,请先升级集群版本。 安装插件时,必须选择Server模式,该模式支持自定义指标。 安装插件后,需要将自定义指标聚合至Kubernetes
对接方式:当前仅支持接入AOM服务。 AOM实例:容器监控会将指标统一上报给AOM服务,因此需要选择一个Prometheus for CCE 类型的AOM实例。默认指标是免费的,而自定义指标将由AOM服务收费,收费标准请参见AOM计费说明。 采集周期:普罗采集指标数据并上报的时间周期。取值范围10~60秒,默认为15秒。
对接方式:当前仅支持接入AOM服务。 AOM实例:容器监控会将指标统一上报给AOM服务,因此需要选择一个Prometheus for CCE 类型的AOM实例。默认指标是免费的,而自定义指标将由AOM服务收费,收费标准请参见AOM计费说明。 采集周期:普罗采集指标数据并上报的时间周期。取值范围10~60秒,默认为15秒。
对接方式:当前仅支持接入AOM服务。 AOM实例:容器监控会将指标统一上报给AOM服务,因此需要选择一个Prometheus for CCE 类型的AOM实例。默认指标是免费的,而自定义指标将由AOM服务收费,收费标准请参见AOM计费说明。 采集周期:普罗采集指标数据并上报的时间周期。取值范围10~60秒,默认为15秒。
监控中心 访问日志 应用拓扑 父主题: 服务网格
目前容器智能分析支持监控华为云集群、附着集群、本地集群、多云集群。在开启监控时,各个集群的参数配置存在差异,因此,本小节将分别介绍这五种集群的开启操作。 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 插件状态说明 kub
单击“添加告警”,输入规则名称如“插件pod指标监控”,选择规则类型为“阈值规则”,选择监控对象为“选择资源对象”。 单击“选择资源对象”按钮,添加方式选择“按指标维度添加”,指标名称下拉选择“云服务指标”>“CCE”>“POD”>“状态”。 指标维度选择“集群名称”为网格集群,“集群
上角“开启监控”按钮。 图1 为集群开启监控 选择需要开启监控的集群。 图2 选择集群 单击“下一步:接入配置”,完成网络配置。 图3 网络配置 完成指标采集配置,本例中使用默认配置参数配置,如图4所示。 指标采集配置参数的具体说明可参考为附着集群开启监控。 图4 指标采集配置 单击“确认接入”,自动返回至“容器洞察
误率大于10%连接呈红色。 单击拓扑中的服务节点,可以查看当前服务在所选时间内的指标数据;单击拓扑中某条连接,可以查看当前连接在所选时间内的指标数据。 自定义查询时间范围不能大于7天。 父主题: 监控中心
为集群开启监控 集群监控概述 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 修改监控配置 关闭监控 父主题: 容器智能分析
容器智能分析是华为云打造的新一代云原生容器运维平台,可实时监控应用及资源,采集各项指标及事件等数据以分析应用健康状态,提供全面、清晰、多维度数据可视化能力,兼容主流开源组件,并提供快捷故障定位的能力。 产品功能 容器洞察:提供基于Kubernetes原生类型的容器监控能力,支持集群、节点、工作负
操作步骤 登录UCS控制台,单击左侧导航栏中的“服务网格”,进入服务网格列表页。 单击服务网格名称,进入服务网格详情页。 在左侧导航栏,单击“监控中心>访问日志”,进入访问日志详情页。 单击“请求分布”页签上,分布时间按钮,可以观测到不同时间的请求数量详情。 自定义查询时间范围不能大于31天。
若您需要基于系统指标对工作负载进行扩缩,则需配置该规则。 指标:可选择“CPU利用率”或“内存利用率”。 期待值:指标数据达到期待值时,触发扩缩。 自定义规则 若您需要基于自定义指标对工作负载进行扩缩,则需配置该规则。 自定义指标名称:在下拉框中选择自定义指标的名称。 指标来源:在下拉