检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点关机后Pod不重新调度 如何避免非GPU/NPU负载调度到GPU/NPU节点? 为什么Pod调度不到某个节点上? 修改kubelet参数导致已驱逐的Pod被重新调度 根据GPU/NPU卡信息定位使用该卡的Pod 父主题: 工作负载
Ingress控制器时,打开“开启指标采集”开关后将自动上报NGINX Ingress控制器指标。 前提条件 集群中已安装3.9.5及以上版本云原生监控插件插件。 集群中已安装2.5.4及以上版本的NGINX Ingress控制器插件,且已打开“开启指标采集”开关。 访问Prometheus 云原生监控插件安装完成后
9的节点,新建节点不涉及该问题,存量低版内核的节点需要升级至已修复版本,详情请参见修复计划。 使用服务转发模式为iptables的集群。 修复计划 如果您使用EulerOS 2.9的节点,请确认节点内核版本是否满足以下要求。如节点内核版本过低,可以选择重置节点或者重新创建节点解决该问题。 已修复的内核版本如下: x86:4
严重 2024-07-01 漏洞影响 该漏洞是由OpenSSH服务器 (sshd) 中的信号处理程序竞争问题引起。攻击者可以利用此漏洞,以未授权的形式在Linux系统上用root身份执行任意代码。 判断方法 查看节点操作系统及openssh版本: 如果集群node节点OS是EulerOS、Huawei
yaml 回显如下表示已开始创建deployment。 deployment "nginx" created 查看deployment状态。 kubectl get deployment deployment状态显示为Running,表示deployment已创建成功。 NAME
Ingress控制器插件并开启“日志采集”功能。 已安装插件时:单击“管理”,找到已安装的插件实例,单击右侧“编辑”,在参数配置中找到“日志采集”并开启。 如果集群中安装了多个NGINX Ingress控制器,需修改每个插件实例的配置才可采集所有实例的日志。 未安装插件时:单击“安装”,在参数配
前往ECS控制台为节点添加SCSI类型的磁盘。操作步骤详情请参见新增磁盘。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“存储”,并切换至“存储池”页签。 查看已添加磁盘的节点,选择“导入持久卷”,导入时可以选择写入模式。 如存储池列表中未找到手动挂载的磁盘,请耐心等待1分钟后刷新列表。 线性:线性逻
没有可用的节点子网,您可以前往VPC创建一个新的节点子网。详情请参见为虚拟私有云创建新的子网。 场景二:VPC网段的IP已分配完 如果整个VPC网段中的IP已分配完,您需要扩容VPC网段,然后创建新的节点子网。 登录控制台,在服务列表中单击“虚拟私有云 VPC”,在虚拟私有云列表
ENV nginx 1/1 Running 0 1m nginx prod 对已存在的Pod,可以直接使用kubectl label命令直接添加Label。 $ kubectl label pod nginx creation_method=manual
haveLabel:节点上是否存在插件中配置的label,如果有,值为1,如果节点上没有,值为0。 前提条件 已创建v1.19.16及以上版本的集群,具体操作请参见购买Standard/Turbo集群。 集群中已安装1.11.5及以上版本的Volcano插件,具体操作请参见Volcano调度器。 配置Volcano节点池软亲和调度策略
安装。仅对未安装NPU驱动的节点生效,已安装 NPU 驱动的节点会保持现状。升级或编辑插件参数时修改驱动版本也只对未安装 NPU 驱动的节点生效。 驱动安装成功后需要重启节点才能生效,驱动安装成功确认方式请参见如何确认节点NPU驱动已安装完成。 插件卸载不会自动删除已安装的NPU
集群中未安装用户自建的Prometheus或Prometheus(停止维护)插件。 开通监控中心 购买集群时开通 登录云容器引擎控制台,购买集群。 在“插件选择”页面,勾选云原生监控插件。 在“插件配置”页面,选择云原生监控插件需要对接的AOM实例。如AccessCode未创建,请先创建AccessCode。
点的稳定性。 所选弹性云服务器挂载的系统盘、数据盘都会在纳管时清理LVM信息,包括卷组(VG)、逻辑卷(LV)、物理卷(PV),请确保信息已备份。 纳管过程中,请勿在弹性云服务器控制台对所选虚拟机做任何操作。 节点纳管至节点池后,如果节点池触发弹性伸缩策略缩容节点,则该节点将会被删除。
Docker场景,即在容器中运行Docker命令,节点需要选择Docker容器引擎。 若工作负载需要被外网访问,请确保集群中至少有一个节点已绑定弹性IP,或已购买负载均衡实例。 通过CCE安装部署Jenkins 在CCE控制台,单击左侧栏目树中的“工作负载 > 无状态负载”,单击右侧“创
重启节点或重启kubelet,重启kubelet的方法如下: systemctl restart kubelet 此时重新拉起或创建工作负载,已可成功执行。 父主题: 规格配置变更
io镜像仓库的镜像进行验签。如需对所有镜像验签,请填写**。 单击“安装”。 待插件安装完成后,选择对应的集群,然后单击左侧导航栏的“插件中心”,可筛选“已安装插件”查看相应的插件。 组件说明 表2 swr-cosign组件 容器组件 说明 资源类型 swr-cosign swr-cosign负
储卷使用云硬盘。 图1 加密存储卷 单击“创建”。 前往“存储卷声明”页面,查看加密云硬盘存储卷声明是否创建成功,并查看存储配置项是否显示已加密。 图2 PVC加密 在应用中使用加密PVC时,和使用普通PVC的方法一致。 通过kubectl自动创建加密云硬盘 使用kubectl连接集群。
工作负载异常:存储卷无法挂载或挂载超时 工作负载异常:一直处于创建中 工作负载异常:Pod一直处于Terminating状态 工作负载异常:已停止 工作负载异常:GPU节点部署服务报错 工作负载异常:添加存储失败 工作负载异常:实例无法写入数据 工作负载异常:Init容器启动失败 工作负载异常:OOM问题
10-r0及以上 v1.28集群:v1.28.8-r0及以上 v1.29集群:v1.29.4-r0及以上 其他更高版本集群 如果升级前集群已开启Secret落盘加密特性,则目标集群的版本同样需要支持Secret落盘加密特性,您需要选择满足条件的版本进行升级。 父主题: 升级前检查异常问题排查
组策略(SecurityGroup)和集群容器网络配置(NetworkAttachmentDefinition)中的安全组。 前提条件 您已创建一个CCE Turbo集群,且集群版本满足以下要求: v1.23集群:v1.23.16-r0及以上版本 v1.25集群:v1.25.11-r0及以上版本