检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题解答: 集群删除之后,部署在集群上的工作负载也会同步删除,无法恢复,请慎重删除集群。 父主题: 集群运行
选择GPU节点驱动版本 使用GPU加速型云服务器时,需要安装正确的Nvidia基础设施软件,才可以使用GPU实现计算加速功能。在使用GPU前,您需要根据GPU型号,选择兼容配套软件包并安装。 本文将介绍如何选择GPU节点的驱动版本及配套的CUDA Toolkit。
分区名称 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 kind 否 String 资源类型 apiVersion 否 String API版本 metadata 否 metadata object 分区的元数据信息 spec 否 spec object 分区的配置信息
验证数据持久化及共享性 查看部署的应用及文件。 执行以下命令,查看已创建的Pod。
请检查该节点的Pod部署数量是否过多,适当驱逐该节点上Pod到其他空闲节点。 父主题: 升级前检查异常问题排查
$ kubectl get ns rdbms -o json > rdbms.json 查看namespace定义的json配置,编辑json文件并删除掉spec部分。
请检查该节点的Pod部署数量是否过多,适当驱逐该节点上Pod到其他空闲节点。 父主题: 升级前检查异常问题排查
例如SFS、OBS等云存储都是通过在集群中安装存储驱动的形式使用的,需要在集群中创建对应的PV,然后使用PVC挂载到Pod中。
Kubeadm:kubeadm config view命令已被弃用,并将在未来版本中删除,请使用kubectl get cm -o yaml -n kube-system kubeadm-config来直接获取kubeadm配置。
表8 bandwidth 参数 参数类型 描述 size Integer 带宽大小 sharetype String 带宽类型 表9 status 参数 参数类型 描述 privateEndpoint String 集群访问的PrivateIP(HA集群返回VIP) publicEndpoint
默认同步检查instant billingConfigOverride 否 ScaleUpBillingConfigOverride object 节点池扩容时覆盖节点的默认计费模式配置 表6 ScaleUpBillingConfigOverride 参数 是否必选 参数类型 描述
前提条件 您已经创建好一个集群,并且在该集群中安装2.3.23及以上版本的CCE容器存储(Everest)。 如果您需要通过命令行创建,需要使用kubectl连接到集群,详情请参见通过kubectl连接集群。
Kubeadm:kubeadm config view命令已被弃用,并将在未来版本中删除,请使用kubectl get cm -o yaml -n kube-system kubeadm-config来直接获取kubeadm配置。
spec 是 RemoveNodesSpec object 配置信息 status 否 TaskStatus object 任务状态 表4 RemoveNodesSpec 参数 是否必选 参数类型 描述 login 是 Login object 节点的登录方式。
批量计算 在CCE集群中部署使用Kubeflow 在CCE集群中部署使用Caffe 在CCE集群中部署使用Tensorflow 在CCE集群中部署使用Flink 在CCE集群中部署使用ClickHouse 在CCE集群中部署使用Spark
installing:安装中,表示插件正在安装中。 installFailed:安装失败,表示插件安装失败,需要卸载后重新安装。 upgrading:升级中,表示插件正在更新中。 upgradeFailed:升级失败,表示插件升级失败,可重试升级或卸载后重新安装。
riskSource riskSource object 风险项 errorCodes Array of strings 错误码集合 表14 riskSource 参数 参数类型 描述 configurationRisks Array of configurationRisks objects 配置风险项
以4U8G节点为例,并提前在集群中部署一个CPU request为1,limit为2的工作负载。 登录到节点池中的一个节点,查看/var/lib/kubelet/cpu_manager_state输出内容。
出现上述问题的原因是CCE创建的节点安装了cloudinit,有默认的linux用户,并且该密钥也是用于linux。 解决方法 使用linux用户登录,使用sudo su命令切换到root用户。 父主题: 节点运行
is not exists#__ __error_code#ErrorCommandNotExist#pidof command is not exists#__ 以上报错代表您的节点上缺少了chage、chown、chmod、mkdir、in、touch、pidof等命令,请安装对应命令之后重新检查