检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PIDPressure node.kubernetes.io/pid-pressure pid.available 节点上的可用进程标识符已低于驱逐条件。 您可以修改节点进程ID上限,详情请参见修改节点进程 ID数量上限kernel.pid_max。 排查项二:是否在实例上设置了tolerations
3-r0之前的集群版本,需要指定查询参数resourceVersion=0;v1.23.8-r0、v1.25.3-r0及之后的版本,CCE已进行优化,会默认查询缓存并确保缓存数据最新。 精确指定查询范围,避免非目标数据额外消耗资源,例如: # client-go查询指定命名空间的Pod代码示例
需要明确指定可用区,不支持随机可用区。 新创建的节点池,仅按照默认规格创建节点,当默认规格资源不足时,会导致节点创建失败。 节点池创建后,已存在节点的规格不可删除。 容器引擎 CCE支持Docker和Containerd容器引擎,不同的集群类型、集群版本、操作系统可能导致支持的容
虚拟化和节点池驱动配置请前往“配置中心 > 异构资源配置”页进行设置。 单击“安装”,安装插件的任务即可提交成功。 卸载插件将会导致重新调度的GPU Pod无法正常运行,但已运行的GPU Pod不会受到影响。 验证插件 插件安装完成后,在GPU节点及调度了GPU资源的容器中执行nvidia-smi命令,验证GPU设备及驱动的可用性。
Autoscaler主要流程包括两部分: 扩容流程: Autoscaler会每隔10s检查一次所有未调度的Pod,根据用户设置的策略,选择出一个符合要求的节点池进行扩容。 Autoscaler检测未调度Pod进行扩容时,使用的是与Kubernetes社区版本一致的调度算法进行模拟调度计算
集,Pod就已经被销毁,可能存在日志采集不到的情况。 解决方案:延长Job的存活时间。 云原生日志采集插件运行正常,部分日志策略未生效 解决方案: 若未生效的日志策略采集类型为事件类型或插件版本低于1.5.0,则检查log-agent-otel-collector工作负载的标准输出。
10-r0、v1.30.6-r0、v1.31.1-r0及以上版本支持该配置。 关闭:不支持使用网络策略(NetworkPolicy)能力,已创建的策略不生效。 开启:在客户配置的服务网段和自建线下网段存在冲突时,新增网关链路调整,可能出现新增网关对应链路的建链不成功。 例如,集群
集群升级后检查任务 taskID String 升级任务项ID status String 集群升级状态: Init: 任务初始状态 Queuing: 任务已进入执行队列 Running: 任务开始执行 Success: 任务执行成功 Failed: 任务执行失败 startTimeStamp String
25及以上版本集群,查看名为default的ServiceAccount状态。 kubectl describe sa default 由回显内容可知,default未自动创建对应的Secret。 Name: default Namespace:
不方便通过replace的方式进行更新。Kubernetes还提供了一种在容器运行时,直接对容器进行修改的方式,就是patch命令。 例如已存在一个Pod的标签为app=nginx1,如果需要在运行过程中,将其修改为app=nginx2。 kubectl patch pod <podname>
集群升级后检查任务 taskID String 升级任务项ID status String 集群升级状态: Init: 任务初始状态 Queuing: 任务已进入执行队列 Running: 任务开始执行 Success: 任务执行成功 Failed: 任务执行失败 startTimeStamp String
控数据对接至AOM并按需废弃自定义指标,从成本和可靠性角度来看,是更优的选择。 前提条件 集群版本为v1.21。 Prometheus插件已升级至可升级的最新版本。 可迁移的云原生监控插件目标版本为3.10.1及以上。 采集数据迁移 迁移至基于本地存储的传统模式时,数据库是自动迁
集群升级后检查任务 taskID String 升级任务项ID status String 集群升级状态: Init: 任务初始状态 Queuing: 任务已进入执行队列 Running: 任务开始执行 Success: 任务执行成功 Failed: 任务执行失败 startTimeStamp String
TIONS)可配置会话保持;选择“源IP算法”(即kubernetes.io/elb.lb-algorithm参数为SOURCE_IP)时已支持基于源IP地址的会话保持,无需重复配置会话保持。 四层会话保持(Service) 四层的模式下可以开启基于源IP的会话保持(基于客户端的IP进行hash路由)。
工作负载伸缩。 CronHPA支持定时调整HPA策略的最大和最小实例数,也可以直接定时调整Deployment的Pod实例数。 前提条件 已安装1.2.13及以上版本CCE容器弹性引擎。 使用CronHPA调整HPA伸缩范围 CronHPA支持定时调整HPA策略的最大和最小实例数,满足复杂场景下的工作负载伸缩。
监控,且支持通过PodSelector来对监控后端做选择,支持多监控任务、可选监控指标,且支持用户获取Pod的label标签信息。监控信息已适配Prometheus格式,可以通过调用Prometheus接口查看监控数据。 使用约束 仅支持在v1.19及以上版本的CCE Turbo
建一个cluster-admin权限(管理员权限),联邦用户由于每次登录注销都会改变用户ID,所以在CCE控制台权限管理处,权限用户会显示已删除,请勿删除该权限,否则会导致鉴权失败。此种情况下建议在CCE为某个用户组创建cluster-admin权限,将联邦用户加入此用户组。 联
压tar包时dockersys分区空间不足,极有可能导致镜像拉取失败。 数据盘空间不足时如何解决 方案一:清理镜像 您可以执行以下步骤清理未使用的镜像: 使用containerd容器引擎的节点: 查看节点上的本地镜像。 crictl images -v 确认镜像无需使用,并通过镜像ID删除无需使用的镜像。
配置负载亲和/反亲和调度策略 您可以通过不同的方式配置负载亲和/反亲和调度策略,将Pod调度到满足条件的节点。 通过控制台配置 通过YAML配置 本文示例中,集群内已创建后端应用的工作负载,且带有app=backend的标签,您可以通过该标签进行工作负载亲和/反亲和调度,将新创建的前端应用(标签为app=
超大规模三控制节点CCE集群(最大2000节点) 说明: 关于规格参数中的字段说明如下: s1:单控制节点的集群,控制节点数为1。单控制节点故障后,集群将不可用,但已运行工作负载不受影响。 s2:三控制节点的集群,即高可用集群,控制节点数为3。当某个控制节点故障时,集群仍然可用。 dec:表示专属云的CCE集群规格。例如cce