检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
详细信息 集群创建失败的原因包括: ntpd没安装或者安装失败、k8s组件预校验不过、磁盘分区错误等,目前只能尝试重新创建,定位方法请参见定位失败原因。 当前集群规模所需的底层资源不足,请选择其他规模的集群类型后重新创建集群。
使用Service实现简单的灰度发布和蓝绿发布 CCE实现灰度发布通常需要向集群额外部署其他开源工具,例如Nginx Ingress,或将业务部署至服务网格,利用服务网格的能力实现。
解决方案 可优先重置节点或手动安装Python之后再进行升级。 父主题: 升级前检查异常问题排查
问题解答: 集群删除之后,部署在集群上的工作负载也会同步删除,无法恢复,请慎重删除集群。 父主题: 集群运行
验证数据持久化 查看部署的应用及磁盘文件。 执行以下命令,查看已创建的Pod。
选择GPU节点驱动版本 使用GPU加速型云服务器时,需要安装正确的Nvidia基础设施软件,才可以使用GPU实现计算加速功能。在使用GPU前,您需要根据GPU型号,选择兼容配套软件包并安装。 本文将介绍如何选择GPU节点的驱动版本及配套的CUDA Toolkit。
方案3: 使用overlayfs存储模式的操作系统,可将业务部署在此类节点上,避免容器内创删文件后占用的磁盘空间不立即释放问题。 父主题: 节点运行
请检查该节点的Pod部署数量是否过多,适当驱逐该节点上Pod到其他空闲节点。 父主题: 升级前检查异常问题排查
批量纳管仅支持添加相同数据盘配置的云服务器。 集群开启IPv6后,只支持纳管所在的子网开启了IPv6功能的节点;集群未开启IPv6,只支持纳管所在的子网未开启IPv6功能的节点。
分区名称 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 kind 否 String 资源类型 apiVersion 否 String API版本 metadata 否 metadata object 分区的元数据信息 spec 否 spec object 分区的配置信息
请检查该节点的Pod部署数量是否过多,适当驱逐该节点上Pod到其他空闲节点。 父主题: 升级前检查异常问题排查
验证数据持久化及共享性 查看部署的应用及文件。 执行以下命令,查看已创建的Pod。
不涉及 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 kind 否 String 资源类型 apiVersion 否 String API版本 metadata 否 metadata object 分区的元数据信息 spec 否 spec object 分区的配置信息
例如SFS、OBS等云存储都是通过在集群中安装存储驱动的形式使用的,需要在集群中创建对应的PV,然后使用PVC挂载到Pod中。
默认同步检查instant billingConfigOverride 否 ScaleUpBillingConfigOverride object 节点池扩容时覆盖节点的默认计费模式配置 表6 ScaleUpBillingConfigOverride 参数 是否必选 参数类型 描述
Kubeadm:kubeadm config view命令已被弃用,并将在未来版本中删除,请使用kubectl get cm -o yaml -n kube-system kubeadm-config来直接获取kubeadm配置。
Kubeadm:kubeadm config view命令已被弃用,并将在未来版本中删除,请使用kubectl get cm -o yaml -n kube-system kubeadm-config来直接获取kubeadm配置。
批量计算 在CCE集群中部署使用Kubeflow 在CCE集群中部署使用Caffe 在CCE集群中部署使用Tensorflow 在CCE集群中部署使用Flink 在CCE集群中部署使用ClickHouse 在CCE集群中部署使用Spark
installing:安装中,表示插件正在安装中。 installFailed:安装失败,表示插件安装失败,需要卸载后重新安装。 upgrading:升级中,表示插件正在更新中。 upgradeFailed:升级失败,表示插件升级失败,可重试升级或卸载后重新安装。
v1.19.8-r1-CCE21.6.1.2.B001 $ kubectl taint node 192.168.10.240 key1=value1:NoSchedule node/192.168.10.240 tainted 通过describe命名和get命令可以查看到污点的配置