检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如上图所示,则为/root/foo和/root/bar这两个文件夹的挂载点存在问题。 执行以下命令,查看卡死的挂载点。 mount -n | grep /root/foo 一般来说,此类卡死的挂载点表示已经没有业务使用,请您确认该挂载点确实废弃之后执行以下命令卸载掉对应卡死的挂载点,然后重新执行上述脚本。 umount
通过节点池升级节点的GPU驱动版本 如果您使用的CUDA库无法与当前的NVIDIA驱动版本匹配,您需要升级节点的驱动版本才可以正常使用GPU节点。建议您以节点池为粒度进行节点NVIDIA驱动版本的管理,创建应用时可调度到指定驱动版本的节点池,在升级驱动时,也可以根据节点池分批次控制升级。
云容器引擎(CCE)严格遵循社区一致性认证,现已支持创建Kubernetes 1.28集群。本文介绍Kubernetes 1.28版本的变更说明。 索引 重要说明 新增特性及特性增强 API变更与弃用 特性门禁及命令行参数 CCE对Kubernetes 1.28版本的增强 参考链接 重要说明 在Kubernetes
云容器引擎(CCE)严格遵循社区一致性认证,现已支持创建Kubernetes 1.28集群。本文介绍Kubernetes 1.28版本的变更说明。 索引 重要说明 新增特性及特性增强 API变更与弃用 特性门禁及命令行参数 CCE对Kubernetes 1.28版本的增强 参考链接 重要说明 在Kubernetes
入门指引 本文旨在帮助您了解云容器引擎(Cloud Container Engine,简称CCE)的基本使用流程以及相关的常见问题,帮助您快速上手容器服务。 您可以通过控制台、Kubectl命令行、API参考使用云容器引擎服务。 使用步骤 完整的云容器引擎使用流程包含以下步骤: 图1
被删除,需要手动删除回收。PVC删除后PV资源状态为“已释放(Released)”,不能直接再次被PVC绑定使用。 如果数据安全性要求较高,建议使用Retain以免误删数据。 定义完之后,使用kubectl create命令创建。 # kubectl create -f sas.yaml
请根据不同的业务诉求选择节点类型,“节点规格”列表中将自动为您筛选该类型下可部署容器服务的规格,供您进一步选择。 节点规格 4 vCPUs | 8 GiB 请根据业务需求选择相应的节点规格。不同的节点规格差别请参见节点规格。 为保证集群中的组件可以正常运行,建议的节点规格为:vCPU≥4核,内存≥8 GiB。
使用类型 单价单位 规格 云容器引擎 CCE CCE Autopilot 按需 时长 元/秒 CCE 内存资源 云容器引擎 CCE CCE Autopilot 按需 时长 元/秒 CCE CPU资源 表2 调整后 产品类型 产品 计费模式 使用类型 单价单位 规格 云容器实例 CCI
检查节点关键数据盘使用量是否满足升级要求 检查/tmp目录是否存在500MB可用空间 解决方案 节点升级过程中需要使用磁盘存储升级组件包,使用/tmp目录存储临时文件。 问题场景一:Master节点磁盘使用量不满足升级要求 请联系技术支持人员排查处理。 问题场景二:用户节点磁盘使用量不满足升级要求 请执
请根据不同的业务诉求选择节点类型,“节点规格”列表中将自动为您筛选该类型下可部署容器服务的规格,供您进一步选择。 节点规格 4 vCPUs | 8 GiB 请根据业务需求选择相应的节点规格。不同的节点规格差别请参见节点规格。 为保证集群中的组件可以正常运行,建议的节点规格为:vCPU≥4核,内存≥8 GiB。
配置项导入:选择一个配置项,将配置项中所有键值都导入为环境变量。 在“容器配置”中找到“生命周期”,在右侧选择“启动后处理”页签,并填写以下参数。 处理方式:命令行脚本。 执行命令:以下命令需分三行填写,其中SPECIAL_LEVEL和SPECIAL_TYPE为工作负载中的环境变量名,即cce-configmap配置项中的键名。
执行完毕后,重新执行升级检查。 问题场景二: 错误信息为“your cce-agent is not the latest version”。 该问题是由于cce-agent不是最新版本且自动更新未能成功导致,通常由OBS地址失效或组件版本过低引起。 解决方式: 登录异常节点执行以下命令,获取
GPU插件关键参数检查异常处理 检查项内容 检查CCE GPU插件中部分配置是否被侵入式修改,被侵入式修改的插件可能导致升级失败。 解决方案 使用kubectl连接集群。 执行以下命令获取插件实例详情。 kubectl get ds nvidia-driver-installer -nkube-system
如何变更CCE集群中的节点规格? 约束与限制 节点池中的节点在ECS侧变更规格后,可能导致节点池弹性伸缩问题,详情请参见CCE节点池内的节点变更规格后会有哪些影响?。 CCE Turbo集群中的部分规格节点仅支持在CCE中创建,无法在ECS控制台变更规格,此种情况下调用ECS A
您可以通过如下命令获取Ingress类别: kubectl get ingress <ingress-name> -oyaml | grep -E ' kubernetes.io/ingress.class: | ingressClassName:' 故障场景:如果上述命令输出为空,说明Ingress资源未指定类别。
在同集群、同操作系统的节点上,参考以下文档进行脚本命令可行性的测试,在节点上手动执行命令,确认脚本命令可行。 修改节点系统级最大文件句柄数 修改节点单进程最大文件句柄数 修改容器单进程最大文件句柄数 (以下命令均需在手动执行命令验证成功后配置)在创建节点或节点池时,在“高级配置 >
致您的业务中断,请谨慎操作。) 节点MemoryPressure 问题根因 节点上的容器占用内存过多导致节点的内存不足。CCE默认节点可用内存值为100 Mi。 问题现象 当节点的可用内存低于memory.available配置项时,则节点状态中MemoryPressure为Tr
kustomize build example -o example.yaml 配置Kubeflow所需存储资源。 katib-mysql mysql-pv-claim minio-pv-claim authservice-pvc 由于Kubeflow在创建时需要配置一些存储资源
划资源分配。详情请参见设置容器规格。 集群当前时间内存的Request水位是否超过80% 是 集群版本是否超期 否 集群版本EOS后,云容器引擎(CCE)将不再支持对该版本的集群创建,同时不提供相应的技术支持,包含新特性更新、漏洞/问题修复、补丁升级以及工单指导、在线排查等客户支
以在一个集群中安装多次,每次安装都会创建一个新的实例。以MySQL模板包为例,如果您想在集群中运行两个数据库,可以安装该模板包两次,每一个数据库都会拥有自己的release 和release name。 更多关于Helm命令的使用方法请参见使用Helm。 从Helm官方推荐的仓库Artifact