会自动重启去恢复。最终导致虽然Pod状态显示正常,但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针: 存活探针:livenessProbe,用于检测容器是否正常,类似于执行ps命令检查进程是否存在。如果容器的存活检查失败,集群会对该容器执行重启操作;若容器的存活检查成功则不执行任何操作。
会自动重启去恢复。最终导致虽然Pod状态显示正常,但Pod中的应用程序异常的情况。 Kubernetes提供了两种健康检查的探针: 存活探针:livenessProbe,用于检测容器是否正常,类似于执行ps命令检查进程是否存在。如果容器的存活检查失败,集群会对该容器执行重启操作;若容器的存活检查成功则不执行任何操作。
集群因插件资源残留开启监控失败怎么办? 问题现象 集群开启监控时,接口返回报错,报错信息中含有“release name already exists”字段。 集群开启监控请求下发成功,但是监控状态为“安装失败”或“未知”,在开启监控页面查看kube-prometheus-sta
集群因策略拦截开启监控失败怎么办? 问题现象 集群开启监控时,接口返回报错,报错信息中含有gatekeeper字段。 集群开启监控请求下发成功,但是监控状态一直显示“安装中”,超时后显示“安装失败”,前往集群中检查插件的Pod状态,Pod的事件中含有gatekeeper字段。 原因分析
此漏洞允许恶意攻击者发起针对HTTP/2 服务器的DDoS攻击,使用 HEADERS 和 RST_STREAM发送一组HTTP请求,并重复此模式以在目标 HTTP/2 服务器上生成大量流量。通过在单个连接中打包多个HEADERS和RST_STREAM帧,显著提升每秒请求量,提升服务器上的CPU利用率,从
单击工作负载名称后的“回退”,选择一个历史版本进行回退。 重新部署 单击工作负载名称后的“更多 > 重新部署”,并单击“是”进行确认,重新部署将重启负载下的全部容器组Pod。 关闭升级 单击工作负载名称后的“更多 > 关闭升级”,并单击“是”进行确认。 工作负载标记为“升级已关闭”后,对其进行的升级将不会被应用到实例。
部署Nginx Ingress后状态为未就绪怎么办? 问题背景 创建Nginx Ingress后,Ingress处于“未就绪”状态。 解决方案 在创建Nginx Ingress前应为对应集群安装Nginx Ingress Controller插件,若未安装会导致Ingress处于
联邦管理面创建HPA后分发到成员集群失败怎么办? 问题背景 在集群联邦管理面创建HPA后,创建PropagationPolicy将其分发到版本低于v1.23的成员集群失败。 可能原因 当前,UCS集群联邦API Server版本为v1.25,因此HPA对象有autoscaling
将已接入联邦且状态异常的集群移出舰队失败怎么办? 问题背景 舰队已开通集群联邦,对在舰队中运行状态异常的集群进行移出舰队操作,移出失败。 解决方案 再次单击目标集群右上角的,重新尝试将其移出舰队。 若重试后仍移出失败,请提交工单,联系技术支持人员进行处理。 父主题: 容器舰队
inux)。 扩容及分区完成后,重启普罗插件。 kubectl delete pod prometheus-server-0 -nmonitoring 重启prometheus-server-0将导致重启期间容器智能分析功能不可用,请合理选择重启时间。 父主题: 本地集群
若回显如下命令,则etcd的节点数据恢复成功: Restore the etcd snapshot successfully. 对etcd节点重启etcd服务,重启过程需要等待几分钟。 mv /var/paas/kubernetes/etcd*.manifest /var/paas/kubernetes/manifests
”,进入ELB监听器的转发策略页面,单击后端服务器组名称,进入后端服务器组页面,切换至后端服务器页签,查看该ELB是否成功绑定对应工作负载。 若后端服务器状态为已删除,请检查Pod的IP网段是否与ELB的VPC网段冲突。 若后端服务器组为空,请执行如下命令查询对应事件,根据事件信
执行kubectl命令报错Error from server (Forbidden)怎么办? 问题描述 在使用集群联邦的过程中,执行kubectl命令,出现如下所示的报错信息。 可能原因 可能是由于集群联邦内成员集群的资源对象ClusterRole或者ClusterRoleBin
附着集群 附着集群接入失败怎么办? 私网接入的集群误删除VPCEP后如何恢复? proxy-agent部署失败怎么办?
有状态负载 在运行过程中会保存数据或状态的工作负载称为“有状态工作负载(statefulset)”,创建的Pod拥有持久型标识符,Pod迁移或销毁重启后,标识符仍会保留。有状态负载不支持弹性伸缩,适用于需要使用持久化存储的场景,如ETCD等。 创建有状态负载 登录UCS控制台,在左侧导航栏中选择“容器舰队”。
Master节点关机后集群控制台不可用怎么办? 问题描述 Master节点关机后,出现集群控制台不可用的情况。 操作步骤 此类问题是由于Cilium社区对“Terminating”状态的Pod并不会进行Cilium Endpoint摘除,导致部分请求分流到关机节点,从而导致请求失败。请按照如下指导处理:
新。 具体请参见自动同步镜像。 云存储迁移 若您的集群使用了云硬盘或文件存储,跨区域迁移可以使用云备份 CBR。CBR为云上的弹性云服务器、裸金属服务器、云硬盘、文件存储、云下VMware虚拟化环境和本地文件目录,提供简单易用的备份服务,当发生病毒入侵、人为误删除等事件时,可将数据恢复到任意备份点。
与其他云服务的关系 华为云UCS为用户提供一个统一的集群服务管理平台,与周边服务的依赖关系如图1所示。 图1 UCS与其他服务关系 表1 UCS与其他服务的关系 服务名称 UCS与其他服务的关系 主要交互功能 云容器引擎 CCE UCS支持接管云容器引擎中的CCE集群、CCE T
本地集群 本地集群接入失败怎么办? 如何手动清理本地集群节点? 如何进行Cgroup降级? 虚拟机SSH连接超时怎么办? 本地集群如何扩容容器智能分析插件的存储磁盘? Master节点关机后集群控制台不可用怎么办? 节点扩容规格后未就绪怎么办? 如何更新本地集群ca/tls证书?
华为云集群状态不可用,报cce cluster not found怎么办? 问题描述 华为云集群状态显示不可用,错误信息为cce cluster not found,please unregister cluster。 可能原因 您在CCE集群控制台手动删除了已注册在UCS中的集群,导致UCS中集群状态显示为不可用。
您即将访问非华为云网站,请注意账号财产安全