检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点镜像层数量异常检查 检查项内容 检查到您的节点上镜像层数量过多(>5000层),可能导致docker/containerd启动过慢,影响docker/containerd标准输出。 如果您集群中使用了nginx,可能会出现转发变慢等问题。 解决方案 请登录节点手动删除用不到的镜像,防止后续升级异常。
集群下所有包周期节点处理策略。 约束限制: 不涉及 取值范围: reset:保留服务器并重置服务器,数据不保留。 retain:保留服务器不重置服务器,数据保留。 默认取值: retain 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String
故障现象 在使用containerd容器引擎场景下,拉取镜像到节点时,概率性缺少镜像层,导致工作负载容器创建失败。 问题根因 docker v1.10 之前支持mediaType 为 application/octet-stream 的layer,而containerd不支持appl
CCE容器存储插件(Everest) 插件介绍 CCE容器存储(Everest)插件基于CSI(即Container Storage Interface)为Kubernetes 集群对接云存储服务的能力。 字段说明 表1 参数描述 参数 是否必选 参数类型 描述 basic 否 object
建议您在新建节点时选择更加轻量、安全的Containerd运行时,同时将存量节点的容器运行时逐步迁移至Containerd,具体操作请参见将节点容器引擎从Docker迁移到Containerd。 Containerd和Docker的对比请参见容器引擎Containerd和Docker。 父主题:
在Kubernetes中,Pod的spec中包含一个restartPolicy字段,其取值包括:Always、OnFailure和Never,默认值为:Always。 Always:当容器失效时,由kubelet自动重启该容器。 OnFailure:当容器终止运行且退出不为0时(正常退出),由kubelet自动重启该容器。
24版本中移除了Dockershim,并从此不再默认支持Docker容器引擎,建议您使用Containerd容器引擎。如果您需要将Docker节点迁移至Containerd节点,详情请参见将节点容器引擎从Docker迁移到Containerd。 表4 v1.27补丁版本发布说明 CCE集群补丁版本号 Kubernetes社区版本
地址。 安装配置kubectl。具体请参见通过kubectl连接集群。 迁移工作负载。 给需要迁移工作负载的节点打上Taint(污点)。 kubectl taint node [node] key=value:[effect] 其中,[node]为待迁移工作负载所在节点的IP;[
如何设置容器umask值? 问题描述 tailf /dev/null的方式启动容器,然后手动执行启动脚本的方式得到的目录的权限是700,而不加tailf由Kubernetes自行启动的方式得到的目录权限却是751。 解决方案 这个问题是因为两种方式设置的umask值不一样,所以创建出来的目录权限不相同。
24版本中移除了Dockershim,并从此不再默认支持Docker容器引擎,建议您使用Containerd容器引擎。如果您需要将Docker节点迁移至Containerd节点,详情请参见将节点容器引擎从Docker迁移到Containerd。 表4 v1.27补丁版本发布说明 CCE集群补丁版本号 Kubernetes社区版本
持。 解决方案 若您的节点池的运行时非containerd,您可通过更新节点池功能将节点池的运行时修改为containerd。 如果您仍想在1.27以上集群中创建并使用docker节点池,可跳过该告警,但推荐您尽快切换至containerd,它提供了更出色的用户体验和更强大的功能。
r的支持。 解决方案 若您的节点的运行时非containerd,您可通过节点重置功能重置节点的运行时为containerd。 如果您仍想在1.27以上集群中创建并使用docker节点,可跳过该告警,但推荐您尽快切换至containerd,它提供了更出色的用户体验和更强大的功能。 父主题:
排查项一:安全组是否被修改 排查项二:集群是否过载 排查项三:集群Secret落盘加密使用的KMS密钥是否有效 如果以上排查思路仍无法解决您的问题,请提交工单寻找客服人员协助您进行定位。 排查项一:安全组是否被修改 登录控制台,选择“服务列表 > 网络 > 虚拟私有云 VPC”,单击左侧导航栏的“访问控制
top node命令为何报错 故障现象 执行kubectl top node命令报错Error from server (ServiceUnavailable): the server is currently unable to handle the request (get nodes
表示按照Job的minAvailable进行抢占。 false:表示按照Job的replicas进行抢占。 说明: Kubernetes原生工作负载(如Deployment)的minAvailable默认值为1,建议配置enableJobStarving: false。 AI大数据场景,创建
CCE Turbo分布式集群 CCE Turbo分布式集群在CCE Turbo集群的基础上增加了管理边缘基础设施的能力,包括智能边缘云Homezone和智能边缘小站IES。启用分布式集群后,一个集群可以统一管理数据中心和边缘的计算资源,用户可以便捷地根据应用的诉求将其部署在对应的区域。
persistentVolumeClaim: claimName: cce-sfs-demo 表1 关键参数说明 前置路径 参数 描述 spec replicas 实例数。 metadata name 新建工作负载的名称。 spec.template.spec.containers image
查看是否存在排水任务,以下为正常回显: kubectl get drainage 图1 排水任务,以下回显表示存在排水任务 请将drainage资源进行删除,删除之后再次触发升级前检查。 执行以下命令删除排水任务。 kubectl delete drainage {排水任务名称} 父主题: 升级前检查异常问题排查
区分的。 动态挂载:仅有状态工作负载支持使用动态挂载,该功能通过volumeClaimTemplates字段实现,并依赖于StorageClass动态创建能力。有状态工作负载通过volumeClaimTemplates字段为每一个Pod关联了一个独有的PVC,而这个PVC又会和对
affinity: {} containers: image: nginx:latest imagePullPolicy: Always name: container-0 volumeMounts: