检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在节点池详情中切换至“弹性伸缩”页签,可以看到弹性伸缩策略的配置及伸缩记录。 图1 查看弹性伸缩策略 您还可以在“策略”页面中查看已创建的弹性伸缩策略: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中单击“策略”,切换至“节点伸缩策略”页签。 您可以查看弹性伸缩策略的配置。单击要策略后方的“更多 >
工作负载异常:存储卷无法挂载或挂载超时 工作负载异常:一直处于创建中 工作负载异常:Pod一直处于Terminating状态 工作负载异常:已停止 工作负载异常:GPU节点部署服务报错 工作负载异常:添加存储失败 工作负载异常:实例无法写入数据 工作负载异常:Init容器启动失败 工作负载异常:OOM问题 工作负载状态正常但未正常工作
负载时必须指定CPU或内存请求值。 配置完成后,单击“确定”。 使用kubectl命令创建命名空间 使用kubectl连接集群,详情请参见通过kubectl连接集群。 您可以使用以下方式创建命名空间。 方式一:通过YAML文件定义命名空间配置,然后通过kubectl apply命令创建命名空间。
运行中容器 个 当前Kubelet所在节点上运行中容器的数量 实际卷数量 个 当前Kubelet所在节点的实际卷数量 期望卷数量 个 当前Kubelet所在节点的期望卷数量 配置错误数量 个 当前Kubelet所在节点的Kubelet配置错误数量 操作速率 次/秒 Kubelet每秒执行的操作的次数
适配CCE v1.21集群 1.2.4 v1.15 v1.17 v1.19 插件依赖例行升级 支持配置插件资源规格 1.2.3 v1.15 v1.17 v1.19 适配ARM64节点部署 1.2.2 v1.15 v1.17 v1.19 增强健康检查能力 1.2.1 v1.15 v1
支持v1.31集群 1.6.1 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 支持自动创建LTS日志流 支持配置Buffer_Chunk_Size、Buffer_Max_Size、Mem_Buf_Limit参数 上报到AOM的事件中添加pod_ip字段
CCE支持的存储在持久化和多节点挂载方面的有什么区别? 创建CCE节点时可以不添加数据盘吗? CCE集群中的EVS存储卷被删除或者过期后是否可以恢复? 公网访问CCE部署的服务并上传OBS,为何报错找不到host? Pod接口ExtendPathMode: PodUID如何与社区client-go兼容? 创建存储卷失败如何解决?
适配CCE v1.27集群 1.2.6 v1.19 v1.21 v1.23 v1.25 支持NPU驱动自动安装 1.2.5 v1.19 v1.21 v1.23 v1.25 支持NPU驱动自动安装 1.2.4 v1.19 v1.21 v1.23 v1.25 适配CCE v1.25集群 1.2
空间”,选择要授权的用户或用户组,再选择具体权限。 对于没有IAM权限的用户,给其他用户和用户组配置权限时,无法选择用户和用户组,此时支持填写用户ID或用户组ID进行配置。 图2 配置命名空间权限 其中自定义权限可以根据需要自定义,选择自定义权限后,在自定义权限一行右侧单击新建自
固定值 取值范围: PostCheckTask spec 是 PostcheckResponseSpec object spec是升级后确认的配置信息。 表3 PostcheckResponseSpec 参数 是否必选 参数类型 描述 clusterID 否 String 集群ID clusterVersion
K8s节点污点检查异常处理 检查项内容 检查节点上是否存在集群升级需要使用到的污点。 表1 检查污点列表 污点名称 污点影响 node.kubernetes.io/upgrade NoSchedule 解决方案 问题场景一:该节点为集群升级过程中跳过的节点。 配置Kubectl命令,具体请参见通过kubectl连接集群。
请您登录CCE控制台,单击集群名称进入集群控制台,在“插件中心”处进行手动卸载,具体插件支持版本以及替换方案可查看帮助文档。 问题场景三:插件配置不满足升级条件,请在插件升级页面升级插件之后重试 升级前检查出现以下报错: please upgrade addon [ ] in the
udo命令到该节点。 问题场景二:关键文件不可修改 集群原地升级过程中会修改/etc/sudoers文件和/etc/sudoers.d/sudoerspaas文件,以获取sudo权限,更新节点上属主和属组为root的组件(例如docker、kubelet等)与相关配置文件。请登录节点执行如下命令,排查文件的可修改性。
控Master节点组件指标。 配置告警 告警是监控的延伸,在集群异常时及时预警,通知集群管理员尽快介入并处理恢复。您可以结合实际业务场景,针对kube-apisever的内存使用量、资源数量、QPS、请求时延等指标配置告警,详情请参见通过CCE配置自定义告警。 由于业务场景存在差
25及以上版本的集群中安装1.0.3版本的OpenKruise插件时,kruise-daemon无法在使用docker容器引擎的节点上运行,请使用containerd容器引擎。 您可以选择以下方案之一进行解决: 方案一:关闭OpenKruise插件的kruise-daemon配置,然后重试集群升级。
业务容器CPU核数限制值之和(未配置限制值时采用节点总量) 内存使用率 节点内存使用率 = 节点的内存使用量除以节点的内存总量。 工作负载内存使用率 = 工作负载各个Pod中内存使用率的平均值 Pod内存使用率 = Pod实际使用的物理内存 / 业务容器物理内存限制值之和(未配置限制值时采用节点总量)
据实际报错信息进行删除。 kubectl delete deploy test-nginx -n default 解决资源冲突后,尝试重新安装模板。 父主题: 模板插件
CCE集群节点中安装kubelet的端口主要有哪些? 如何配置Pod使用GPU节点的加速能力? 容器使用SCSI类型云硬盘偶现IO卡住如何解决? docker审计日志量过大影响磁盘IO如何解决? thinpool磁盘空间耗尽导致容器或节点异常时,如何解决? CCE节点上监听的端口列表
com/gpu资源(即配置nvidia.com/gpu为小数,例如0.5)时将通过虚拟化GPU提供,实现GPU显存隔离,按照设定值的百分比为容器分配GPU显存(例如分配0.5×16GiB=8GiB的GPU显存,该数值需为128MiB的整数倍否则会自动向下取整)。配置nvidia.co
var/lib、/var/script、/mnt/paas、/opt/cloud,否则会导致系统或节点安装失败。 挂载路径 请输入挂载路径,如:/tmp。 数据存储挂载到容器上的路径。请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若