检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源概况:Pod状态、容器数量(异常/总数)以及异常事件。 监控概览:包括CPU使用率、内存使用率和网络流入/流出速率这些常见的监控指标。 图2 资源概况和监控概览 容器使用趋势:包括Pod中各容器的CPU使用率、CPU使用量、内存使用率和内存使用量(在图表左上角切换对应指标),并且支持查看降序To
资源概况:包括负载状态、Pod数量(异常/总数)以及异常事件。 监控概览:包括CPU使用率、内存使用率和网络流入/流出速率这些常见的监控指标。 图2 资源概况和监控概览 Pod使用趋势:包括工作负载中各Pod的CPU使用率、CPU使用量、内存使用率和内存使用量(在图表左上角切换对应指标),并且支持查看降序
metrics-server 从 Kubernetes 1.8开始,Kubernetes 通过 Metrics API 提供资源使用指标,例如容器CPU和内存使用率。这些度量可以由用户直接访问(例如:通过使用kubectl top命令),或者由集群中的控制器(例如:Horizontal Pod Aut
XGPU视图 集群 集群--XGPU设备显存使用率 集群--XGPU设备算力使用率 节点--XGPU设备显存使用率 节点--XGPU设备算力使用率 节点--XGPU设备数量 节点--XGPU设备显存分配量 GPU卡--XGPU设备显存使用率 GPU卡--XGPU设备显存分配量 GPU卡--XGPU设备显存分配率
数据迁移 本节介绍镜像及集群依赖服务的相关数据迁移,如云存储、云数据库、分布式缓存、分布式消息等。 镜像迁移 镜像的跨区域迁移可以使用容器镜像服务 SWR的“镜像同步”功能。 对于镜像仓库中已有的镜像,您需要执行手动镜像同步,将镜像同步到目标区域。另外,为镜像设置镜像自动同步功能
容。 查看集群内节点列表 节点列表中包含节点名称、状态、IP地址、Pod(已分配/总额度)、CPU申请比率/限制比率/使用率,以及内存申请比率/限制比率/使用率等信息。 图1 节点列表页面 您可以通过在列表上方按照节点名称、状态、私有地址和公网地址进行筛选,快速找到需要的节点。在
everest插件状态 everest近24小时CPU使用率最大值是否超过80% everest近24小时内存使用率最大值是否超过80% kube-prometheus-stack插件状态 kube-prometheus-stack近24小时CPU使用率最大值是否超过80% kube-prom
在资源消耗TOP统计中,UCS服务会将CPU使用率和内存使用率排名前五的节点、无状态负载、有状态负载和Pod纳入统计范围,以帮助您识别资源消耗“大户”。 说明: CPU使用率 工作负载CPU使用率 = 工作负载各个Pod中CPU使用率的平均值 Pod CPU使用率 = Pod实际使用的CPU核数
换、调度和迁移,故障倒换方案示意如图1所示。 图1 多云集群应用故障倒换示意图 约束限制 您需要拥有两个Kubernetes版本为1.19及以上的可用集群,并且各个集群中至少拥有一个可用节点。 您需要已有一个公网域名,并添加至华为云云解析(DNS)服务,具体操作请参考快速添加网站域名解析。
集群总览”页签查看已开启监控的集群,列表中显示容器舰队内所有集群的CPU使用率、CPU分配率、内存分配率和使用率等指标。 页面简介 集群总览页面,可以展示同一容器舰队下所有集群详细信息,包括集群状态、类型、所在区域、CPU/内存使用率、CPU/内存分配率、节点正常/总数,可以进行集群开启/关闭操作,修改集群监控配置。
示例:某公司权限设计及配置 假设A公司在华为云使用UCS服务管理多集群,公司中有多个职能团队,分别负责权限分配、资源管理、创建应用、流量分发、监控运维等。结合使用IAM和UCS的权限管理,可以实现精细化授权的目标。 图1 组织结构示意图 行管团队:负责管理公司所有资源的团队。 开发团队:负责业务开发的团队。
查看当前镜像仓库的基本信息,单击此镜像仓库,进入容器镜像服务。 图1 镜像仓库 容器镜像服务上传镜像的详细操作请参见客户端上传镜像。 使用镜像 通过UCS管理的集群及联邦,均支持使用镜像仓库创建工作负载。镜像上传成功后,在集群中创建工作负载时可选择“镜像创建”,以UCS接管的CCE集群为例,具体操作如下:
若您的集群使用文件存储,迁移上云可以使用华为云弹性文件服务 SFS,具体请参见数据迁移。 数据库迁移 若您的数据库采用集群外的非容器化部署方案,且需将数据库搬迁上云,可以使用华为云数据复制服务 DRS帮助完成数据库迁移。DRS服务具有实时迁移、备份迁移、实时同步、数据订阅和实时灾备等多种功能。
OBS中。 若您的集群使用了文件存储,跨云迁移可以使用华为云弹性文件服务 SFS,具体请参见数据迁移。 数据库迁移 若您的数据库需要搬迁至华为云,可以使用数据复制服务 DRS帮助完成数据库迁移。DRS服务具有实时迁移、备份迁移、实时同步、数据订阅和实时灾备等多种功能。 其他数据迁移 大数据场景迁移:推荐使用华为云云数据迁移
metrics-server:metrics-server从kubelet公开的Summary API中采集度量数据,提供基础资源使用指标,例如容器CPU和内存使用率。 为本地集群安装metrics-server,请参见metrics-server。 为其他集群安装metrics-server,请参见社
查看FederatedHPA策略,可以看到6m23s时负载的CPU使用率为200%,超过了目标值,此时触发了FederatedHPA策略,将工作负载扩容为4个Pod,随后的几分钟内,CPU使用并未下降,直到到8m16s时CPU使用率才开始下降,这是因为新创建的Pod并不一定创建成功,可能是
Agent模式占用集群资源较低,为集群提供普罗指标采集能力,但不支持基于自定义普罗语句的HPA及健康诊断功能。Server模式为集群提供普罗指标采集能力,支持基于自定义普罗语句的HPA及健康诊断功能,依赖PVC,内存消耗较大。 插件规格:如果部署模式选择“Agent模式”,插件规
Agent模式占用集群资源较低,为集群提供普罗指标采集能力,但不支持基于自定义普罗语句的HPA及健康诊断功能。Server模式为集群提供普罗指标采集能力,支持基于自定义普罗语句的HPA及健康诊断功能,依赖PVC,内存消耗较大。 插件规格:如果部署模式选择“Agent模式”,插件规
单击“确认接入”,自动返回至“容器洞察 > 集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,此时集群已经处于容器智能分析的守护中了。 后续步骤 为集群开启监控监控后,您可以进行集群的智能可视化运维,具体操作请参见容器智能分析。
Agent模式占用集群资源较低,为集群提供普罗指标采集能力,但不支持基于自定义普罗语句的HPA及健康诊断功能。Server模式为集群提供普罗指标采集能力,支持基于自定义普罗语句的HPA及健康诊断功能,依赖PVC,内存消耗较大。 插件规格:如果部署模式选择“Agent模式”,插件规