检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点ARP表项超过限制 问题现象 ARP缓存超限,容器网络的访问出现异常,例如coredns域名解析概率失败。 问题根因 出现该问题的原因是节点上容器缓存的ARP表项超过限制。 问题定位 在节点操作系统内核为4.3以上时,dmsg日志中会有显性的打印neighbor table
性能损失,且无法获取到客户端源IP。 节点级别:只有通过负载所在节点的IP+访问端口才可以访问此服务关联的负载,服务访问没有因路由跳转导致的性能损失,且可以获取到客户端源IP。 端口配置: 协议:TCP。 服务端口:访问Service的端口。 容器端口:容器中应用启动监听的端口,该应用镜像请设置为:8080。
memory)上限进行控制。启用该功能后,用户创建命名空间时将自动创建ResourceQuota对象 在高并发场景下(如批量创建pod),配额管理机制可能导致部分请求因冲突而失败,除非必要不建议启用该功能;如启用,请确保请求客户端具备重试机制 父主题: 集群
是1.13或以上版本,则无需升级。 创建节点时可通过postInstall文件注入的方式开启kubelet的鉴权模式(设置kubelet的启动参数:--authorization-node=Webhook),步骤如下: 创建clusterrolebinding,执行命令: kubectl
节点创建失败 CCE 创建节点失败立即触发 查看创建节点失败原因,尝试重新创建节点 扩容节点超时 CCE 扩容节点超时立即触发 查看扩容节点失超时原因,尝试重新扩容节点 缩容节点失败 CCE 缩容节点超时立即触发 查看缩容节点失超时原因,尝试重新缩容节点 拉取镜像重试失败 CCE
这些报文都会经过Proxy。 传输文件总量很大的话,会消耗很多资源,目前proxy分配内存128M,在压测场景下,损耗非常大,最终导致请求失败。 目前压测所有流量都经过Proxy,业务量大就要加大分配资源。 解决方法 传文件涉及大量报文复制,会占用内存,建议把Proxy内存根据实际场景调高后再进行访问和上传。
对于节点内核版本小于5.9的场景,CCE集群在IPVS模式下,通过Service方式访问集群内部服务,偶现1秒延时或者后端业务升级后访问Service失败的情况,引起该问题的主要原因为社区IPVS连接复用Bug。 IPVS连接复用参数说明 IPVS对端口的复用策略主要由内核参数net.ipv4
节点Sudo检查异常处理 检查项内容 检查当前节点sudo命令,sudo相关文件是否正常。 解决方案 问题场景一:sudo命令执行失败 集群原地升级过程中依赖sudo命令正常可用,请登录节点执行如下命令,排查sudo命令可用性。 sudo echo hello 如果sudo命令不
致DNS请求概率失败,影响用户业务正常运行。在Kubernetes使用的过程中,发现有些场景下工作负载的域名解析存在冗余的DNS查询,使得高并发场景更容易触及DNS的性能瓶颈。根据业务使用场景,对工作负载的DNS配置进行优化,能够在一定程度上减少DNS请求概率失败的问题。 更多D
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决? 问题描述 当节点上的thinpool磁盘空间接近写满时,概率性出现以下异常: 在容器内创建文件或目录失败、容器内文件系统只读、节点被标记disk-pressure污点及节点不可用状态等。 用户可手动在节点上执行docker info查看当前t
(推荐) ENV LD_LIBRARY_PATH /usr/local/nvidia/lib64:$LD_LIBRARY_PATH 镜像的启动命令中配置LD_LIBRARY_PATH。 /bin/bash -c "export LD_LIBRARY_PATH=/usr/local
控制台创建一个公网类型负载均衡器。 端口配置: 对外协议:TCP。 服务端口:设置为80,该端口号将映射到容器端口。 容器端口:容器中应用启动监听的端口,wordpress镜像请设置为80,其他应用容器端口和应用本身的端口一致。 图4 创建服务 单击右下角“创建工作负载”。 等待工作负载创建成功。
/opt/cloud/cce/kubernetes/kubelet/kubelet kubelet命令行启动参数 - /opt/cloud/cce/kubernetes/kubelet/kubelet_config.yaml kubelet启动参数配置 - /opt/cloud/cce/kubernetes/kube-proxy/kube-proxy
集群中的每个Service都有自己的地址,在CCE上创建集群时,可以指定Service的地址段(即服务网段)。服务网段不能和子网网段重合,而且服务网段也不能和容器网段重叠。服务网段只在集群内使用,不能在集群外使用。 服务端口范围配置 NodePort端口范围,默认范围为30000-32767,支持的
节点状态变成不可用,无法部署工作负载到此节点 卸载已安装软件,尝试恢复或重置节点,具体请参见重置节点。 修改NetworkManager的配置 节点不可用 重置节点,具体请参见重置节点。 删除节点上的cce-pause等系统镜像 导致无法正常创建容器,且无法拉取系统镜像 请从其他正常节点复制该镜像恢复
如何排查已创建的集群是否为高可用集群? 包周期的CCE集群到期可以直接删除吗? 更多 工作负载类 工作负载异常定位思路 工作负载异常:实例调度失败 工作负载异常:重新拉取镜像失败 工作负载异常:重新启动容器失败 工作负载异常:Evicted 工作负载异常:实例驱逐异常 更多 域名DNS类 CCE是否有DNS服务?
本例中的容器可以自动重启,因此kubelet会再去启动它。输入多几次这个命令查看它是如何被关闭又被启动的: kubectl get pod memory-demo-2 --namespace=mem-example 这个输出显示了容器被关闭,被启动,又被关闭,又被启动的过程: $ kubectl get
系统资源利用率更高。相比虚拟机技术,一个相同配置的主机,往往可以运行更多数量的应用。 更快速的启动时间。 容器直接运行于宿主机内核,无需启动完整的操作系统,可以做到秒级甚至毫秒级的启动时间。大大节约开发、测试和部署的时间。 一致的运行环境。 容器镜像提供了完整的运行时环境,确保应
Pod被调度到资源无法满足要求的节点上,导致Pod无法运行;状态混乱过高的Request同样会降低节点的资源利用率。 Pod探针配置 Pod中的容器是否配置存活探针 否 建议配置存活探针,若未配置存活探针(livenessProbe),在Pod应用异常时,无法被及时感知并重启,从
重试集群升级任务 功能介绍 重新执行失败的集群升级任务。 集群升级涉及多维度的组件升级操作,强烈建议统一通过CCE控制台执行交互式升级,降低集群升级过程的业务意外受损风险; 当前集群升级相关接口受限开放。 调用方法 请参见如何调用API。 URI POST /api/v3/pro