检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如下为当前已经发布的集群版本与操作系统版本的对应关系,请参考: 表1 弹性云服务器-虚拟机节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型 云原生网络2.0 Huawei Cloud EulerOS 2.0 v1.31 √
存同时隔离两类场景。 兼容:业务无需重新编译,无需进行CUDA库替换,对业务无感。 前提条件 配置 支持版本 集群版本 v1.23.8-r0、v1.25.3-r0及以上 操作系统 Huawei Cloud EulerOS 2.0操作系统 GPU类型 支持Tesla T4、Tesla
Ubuntu 22.04 OverlayFS 不支持自定义Pod容器空间。 Huawei Cloud EulerOS 1.1 OverlayFS 不支持自定义Pod容器空间。 Huawei Cloud EulerOS 2.0 OverlayFS 集群版本为v1.23.14-r0、v1.25
检查关键组件Kubelet的运行状态 无 KubeProxy异常 KubeProxyProblem 检查关键组件KubeProxy的运行状态 无 表4 系统指标 故障检查项 功能 说明 连接跟踪表耗尽 ConntrackFullProblem 检查连接跟踪表是否耗尽 默认阈值:90% 使
在左侧导航栏中选择“监控中心”,单击“Pod”页签。 Pod列表页面呈现了所有Pod的综合信息,如需深入了解单个Pod的监控情况,可单击Pod名称,进入该Pod的“概览”页面,通过切换“容器列表”、“监控”页签查看相应内容。 Pod列表 Pod列表中包含Pod名称、状态、命名空间、Pod IP、
接使用,也可替换为任意合法IP。 若回显为如下则表示节点存在隐患(10.2.0.35为示例节点eth0网卡IP,具体以实际回显为准): WARNING, node 10.2.0.35 is affected 若回显如下则表示节点无此问题: node 10.2.0.35 works
'{print $2}'` 排查项八:DNS地址配置错误 登录节点,在日志/var/log/cloud-init-output.log中查看是否有域名解析失败相关的报错。 cat /var/log/cloud-init-output.log | grep resolv 如果回显包含如下内容则说明无法解析该域名。
分布式的场景,要求每个Pod都有自己单独的状态时,比如分布式数据库,每个Pod要求有单独的存储,这时Deployment无法满足业务需求。 分布式有状态应用的特点主要是应用中每个部分的角色不同(即分工不同),比如数据库有主备、Pod之间有依赖,在Kubernetes中部署有状态应用对Pod有如下要求:
业务风险,降低故障带来的影响面,同时支持快速回滚。 以下示意图可描述灰度发布的大致流程:先切分20%的流量到新版本,若表现正常,逐步增加流量占比,继续测试新版本表现。若新版本一直很稳定,那么将所有流量都切分到新版本,并下线老版本。 切分20%的流量到新版本后,新版本出现异常,则快速将流量切回老版本。
Ubuntu 22.04 OverlayFS 不支持自定义Pod容器空间。 Huawei Cloud EulerOS 1.1 OverlayFS 不支持自定义Pod容器空间。 Huawei Cloud EulerOS 2.0 OverlayFS 集群版本为v1.23.14-r0、v1.25
在左侧导航栏中选择“监控中心”,单击“工作负载”页签。 工作负载列表页面呈现了所有工作负载的综合信息,如需深入了解单个工作负载的监控情况,可单击工作负载名称,进入该工作负载的“概览”页面,通过切换“Pod列表”、“监控”页签查看相应内容。 工作负载列表 工作负载列表中包含工作负载名称、状态、Pod个数(正
负载Pod一直无法创建。 解决方案: 登录该问题节点。 手动解压节点上的cce-pause镜像安装包。 tar -xzvf /opt/cloud/cce/package/node-package/pause-*.tgz 导入镜像。 Docker节点: docker load -i
从Pod访问公网 从Pod访问公网的实现方式 从Pod中访问公网地址的实现方式会因集群网络模式的不同而不同,具体请参见表1。 表1 从Pod访问公网的实现方式 实现方式 容器隧道网络 VPC网络 云原生2.0网络 给容器所在节点绑定公网IP 支持 支持 不支持 给Pod绑定弹性公网IP
在导航栏左侧单击“插件中心”,进入插件中心首页。 选择“CCE 突发弹性引擎 (对接 CCI)”插件,单击“卸载”。 表2 特殊场景说明 特殊场景描述 场景现象 场景说明 CCE集群无节点,卸载插件。 插件卸载失败。 bursting插件卸载时会在集群中启动Job用于清理资源,卸载插件时请保证集群中至少有一个可以调度的节点。
实例接管工作,业务无感知。 集群管理:集群严重过载时,可能会处于不可用状态,此时无法进行集群管理操作,例如创建或删除节点等。 常见的导致集群过载的原因: 集群资源数据量过大 etcd和kube-apiserver是集群控制平面的两个核心组件,etcd是后台数据库,负责存储所有集群
550 300 16 8 256 6/无 c7.12xlarge.2 48 96 35/14.4 750 400 16 8 256 8/无 c7.16xlarge.2 64 128 36/19.2 1000 500 28 8 256 12/无 c7.24xlarge.2 96 192
在左侧导航栏中选择“监控中心”,单击“节点”页签。 节点列表页面呈现了所有节点的综合信息,如需深入了解单个节点的监控情况,可单击节点名称,进入该节点的“概览”页面,通过切换“Pod列表”、“监控”页签查看相应内容。 节点列表 节点列表中包含节点名称、状态、IP地址、Pod(已分配/总额
查条件时将无法继续升级。为了能够更好地避免升级风险,本文提供全量的升级前检查问题及解决方案,帮助您对可能存在的升级故障进行预处理。 表1 检查项列表 序号 检查项名称 检查项说明 1 节点限制检查异常处理 检查节点是否可用 检查节点操作系统是否支持升级 检查节点是否含有非预期的节点池标签
CCE容器存储插件(Everest)版本发布记录 表1 CCE容器存储插件(Everest)版本记录 插件版本 支持的集群版本 更新特性 2.4.105 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE v1.31集群 2.4.75 v1.23 v1
迁移节点 您可以将同一个集群下节点在节点池间进行迁移,具体迁移场景如表1。 表1 迁移场景 迁移场景 是否支持迁移 操作步骤 原节点池 待迁移的目标节点池 自定义节点池 默认节点池(DefaultPool) 支持迁移 将自定义节点池中的节点迁移到默认节点池 默认节点池(DefaultPool)