检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
登录GPU隔离事件发生的节点。 进入/usr/local/nvidia/bin目录,执行nvidia-smi -q命令。 若nvidia-smi命令不存在或执行失败,有可能是驱动安装未就绪导致,可以重新安装GPU驱动后,再重试。 观察执行结果中的ECC ERROR(发生ECC故障的记录)。 Correctable
命名空间”,选择要授权的用户或用户组,再选择具体权限。 对于没有IAM权限的用户,给其他用户和用户组配置权限时,无法选择用户和用户组,此时支持填写用户ID或用户组ID进行配置。 图1 配置命名空间权限 其中自定义权限可以根据需要自定义,选择自定义权限后,在自定义权限一行右侧单击新
小权限原则,只给予受信用户创建及管理Ingress的权限。 社区已发布nginx-ingress v1.11.2版本修复该漏洞,但该版本仅支持 Kubernetes >= 1.26 ,因此若CCE集群版本低于v1.27,请先升级集群版本。 相关链接 社区已经发布版本修复:https://github
ent-arm 重启cce-agent服务。 systemctl restart cce-agent 若您对上述执行过程有疑问,请联系技术支持人员。 父主题: 升级前检查异常问题排查
区3的节点有CPU资源,导致无法调度。由此可见PVC先绑定PV创建云硬盘会导致问题。 延迟绑定的云硬盘StorageClass 在集群中查看StorageClass,可以看到csi-disk-topology的绑定模式为WaitForFirstConsumer,表示等有Pod使用
置更新策略为逐步更新,在控制更新过程中存在可用的Pod数量,确保服务的连续性和减少停机时间。例如,对于一个有多个Pod的Deployment,您在滚动更新时可以控制最多可以有多少老Pod处于不可用状态、最多有多少新Pod启动并运行,直到更新完成。逐步更新的方法有助于确保服务的稳定
容器资源(CPU、内存)配额。 表3 custom 参数 是否必选 参数类型 描述 serviceType 是 String 外部访问类型,支持NodePort或ELB,默认NodePort。 port 否 int kubernetes-dashboard service的port值,默认8443
nodeAffinity 节点亲和可以实现nodeSelector的能力,但其表达能力更强,您可以根据节点上的标签,使用标签选择器来筛选需要亲和的节点,支持必须满足和尽量满足的亲和性规则。 说明: 如果同时指定nodeSelector和nodeAffinity,则两者必须都要满足,才能将Pod调度到候选节点上。
CD实现持续交付 使用Jenkins和Gitlab实现多集群隔离的DevOps 网络相关 CCE Turbo配置容器网卡动态预热 保留Pod IP非伪装网段最佳实践 使用VPC和云专线实现容器与IDC之间的网络通信 集群通过企业路由器连接对端VPC 不同场景下容器内获取客户端源IP 容器网络带宽限制的配置建议
对象存储中拉取对应的备份,按需进行集群资源的还原。 根据迁移方案所述,在迁移开始前需准备临时的对象存储用于存放资源的备份文件,Velero支持使用OBS或者MinIO对象存储。对象存储需要准备足够的存储空间用于存放备份文件,请根据您的集群规模和数据量自行估算存储空间。建议您使用O
object 节点的登录方式。密钥对和密码登录方式二者必选其一。 说明: 更新节点池时,不支持修改此参数 nodes 是 Array of NodeItem objects 待操作节点列表,当前最多支持同时移除200个节点。 表5 Login 参数 是否必选 参数类型 描述 sshKey
产品变更公告 2024/04/26 15 1.23版本集群停止维护公告 集群版本公告 2024/04/25 16 关于CCE集群Docker支持策略公告 产品变更公告 2024/02/19 17 runc漏洞(CVE-2024-21626)对CCE服务的影响说明 漏洞公告 2024/02/01
时,会产生8次DNS查询,因为对于每个域名需要查询两次,分别是IPv4和IPv6。 options:定义域名解析配置文件的其他选项,常见的有timeout、ndots等等。 Kubernetes集群容器的域名解析文件设置为options ndots:5,该参数的含义是当域名的“.
您可以扩容集群管理规模,集群管理规模越大,控制节点规格越高、性能也更佳。操作详情请参见变更集群规格。 如果您出现以上集群过载的情况,您也可以提交工单以获取技术支持。 排查项三:集群Secret落盘加密使用的KMS密钥是否有效 问题现象 当出现集群不可用,您可以查看集群事件确认异常原因。 当集群事件中
0)SFS存储卷时,集群中需要安装2.0.9及以上版本的CCE容器存储(Everest)。 使用通用文件系统(SFS 3.0)SFS存储卷时,挂载点不支持修改属组和权限,挂载点默认属主为root。 使用通用文件系统(SFS 3.0)时,创建、删除PVC和PV过程中可能存在时延,实际计费时长请以SFS侧创建、删除时刻为准。
kube-scheduler调度器在分配Pod时不会考虑应用的实际负载,如果应用负载不均匀可能导致某些节点的负载较高,而其他节点的负载较低。 Volcano调度器支持使用负载感知调度功能,感知集群内节点CPU、Memory的负载情况,将Pod优先调度到负载较低的节点,实现节点负载均衡,避免出现因单个节点
name}{"\n"}{end}' | grep <secret_id> 仅v1.19.16-r2、v1.21.5-r0、v1.23.3-r0及以上版本的集群支持使用ELB服务中的证书,上述版本集群请参考方案一处理,其他版本集群请参考方案二处理。 方案一:您可以将Ingress使用的证书替换为ELB
UpgradeFeatureGates 参数 参数类型 描述 supportUpgradePageV4 Boolean 集群升级Console界面是否支持V4版本,该字段一般由CCE Console使用。 表7 UpgradeInfoStatus 参数 参数类型 描述 phase String
ken认证:https://bbs.huaweicloud.com/videos/101333。 AK/SK认证 AK/SK签名认证方式仅支持消息体大小在12MB以内,12MB以上的请求请使用Token认证。 AK/SK认证就是使用AK/SK对请求进行签名,在请求时将签名信息添加到消息头,从而通过身份认证。
资源得以保留,且运行不受影响。关于包年/包月资源到期后的状态说明,请参见到期后影响。 续费相关的功能 使用云容器引擎CCE时,仅集群和节点支持从CCE控制台续费包年/包月资源,本文介绍集群和节点续费相关内容,如表1所示。 表1 续费相关的功能 功能 计费项 说明 手动续费 集群