检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
记录当前版本驱动状态。根据CCE AI套件(NVIDIA GPU)插件版本差异,查询驱动的命令如下: 1.x.x版本执行: /opt/cloud/cce/nvidia/bin/nvidia-smi 2.0.0-2.5.3版本执行:/usr/local/nvidia/bin/nvidia-smi
zone),可在指定可用区调度时使用。 kubernetes.io/hostname:节点的hostname,可在指定节点调度时使用。 cce.cloud.com/cce-nodepool:节点所属的节点池,可在指定节点池调度时使用。 本示例中,必须满足的规则表示调度的节点必须包含一个键名
若回显为工具使用介绍,则表示已安装,无需重复安装。若未安装growpart扩容工具,可执行以下命令安装。 yum install cloud-utils-growpart 执行以下命令,查看系统盘“/dev/vda”的总容量。 fdisk -l 回显信息如下,系统盘“/dev/vda”的总容量为100GiB:
t_id}/clusters/{cluster_id}/operation/hibernate cce:cluster:stop √ √ 变更集群规格 POST /api/v2/projects/{project_id}/clusters/:clusterid/resize cce:cluster:resize
io/memory-pressure memory.available 节点上的可用内存已满足驱逐条件。 您可以扩容节点规格,详情请参见如何变更CCE集群中的节点规格?。 DiskPressure node.kubernetes.io/disk-pressure nodefs.available、nodefs
集群创建完成后,您可以在集群中创建节点。 登录CCE控制台。 在左侧导航栏中选择“集群管理”,单击要创建节点的集群进入集群控制台。 在集群控制台左侧导航栏中选择“节点管理”,切换至“节点”页签并单击右上角的“创建节点”,在节点配置步骤中参照如下表格设置节点参数。 节点配置: 配置节点云服务器的规格与操作系统,为节点上的容器应用提供基本运行环境。
区域对应的项目中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问CCE时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒
Turbo不支持动态创建,因此SFS1.0在迁移至SFS Turbo后,该有状态应用不再支持“动态挂载”的自动扩容能力。 在集群控制台左侧导航栏中选择“工作负载”,切换至“有状态负载”页签,找到目标工作负载,记录缩容前的实例数,并将工作负载实例数需要缩容到0。 对每个实例使用的PVC均需要执行步骤2~6。
核时单价 CPU 每核每小时价格。 用来指导您工作负载所在节点对应的机型的CPU核时单价。如果工作负载或者命名空间对应核时单价很贵,则可以通过变更节点类型等方式进行降本增效。 所属命名空间 工作负载所在命名空间 CPU平均利用率 所选时间周期内,工作负载的 CPU 平均利用率,用来指导您工作负载的CPU资源使用效率。
全局日志查询:支持查看所有日志组日志流下的日志信息。可通过选择日志流查看所选日志流中的日志信息,默认会选择集群默认日志组(k8s-log-{集群ID}),可通过单击切换日志组右侧的图标切换其他日志组。 图6 全局日志查询 插件日志:显示默认日志组(k8s-log-{集群ID})下的插件上报的日志数据,用于查看集群插件日志信息。
示例: docker tag hpa-example:latest swr.cn-east-3.myhuaweicloud.com/cloud-develop/hpa-example:latest 上传镜像至镜像仓库。 docker push [镜像仓库地址]/[组织名称]/[镜像名称2:版本名称2]
在集群内访问 创建Ingress,通过新部署的Nginx Ingress Controller提供网络访问。 在左侧导航栏中选择“服务”,切换至“路由”页签,单击右上角“YAML创建”。 对接非插件部署的Nginx Ingress Controller时,只支持使用YAML的方式创建Ingress。
示例: docker tag hpa-example:latest swr.cn-east-3.myhuaweicloud.com/cloud-develop/hpa-example:latest 上传镜像至镜像仓库。 docker push [镜像仓库地址]/[组织名称]/[镜像名称2:版本名称2]
末尾的域名即为SWR镜像仓库地址,例如swr.cn-north-4.myhuaweicloud.com。注意每个Region的地址不同,请切换到对应Region获取。如果为“registry/namespace”形式,还要将namespace替换为SWR的组织名称。 userna
t_id}/clusters/{cluster_id}/operation/hibernate cce:cluster:stop √ √ 变更集群规格 POST /api/v2/projects/{project_id}/clusters/:clusterid/resize cce:cluster:resize
在“扩展功能”中开启“NUMA拓扑调度”能力,单击“确定”。 Volcano 1.7.1以下版本 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“配置中心”,切换至“调度配置”页面,选择Volcano调度器找到对应的“专家模式”,单击“开始使用”。 开启resource_exporter_enabl
"nvidia-install-dir-host" #GPU驱动的安装目录 hostPath: path: "/opt/cloud/cce/nvidia" #GPU插件版本为2.0.0及以上时,该驱动的安装目录需替换为"/usr/local/nvidia"
rollout-canary 本示例中,剩余的步骤是完全自动化的,直到完全过渡到新版本。通过以下命令查看详细过程,该Rollout会逐渐完成全部流量切换。 kubectl argo rollouts get rollout rollout-canary --watch 如需使用更多Argo
详情请参见重调度(Descheduler)。 节点池亲和性调度 在替换节点池、节点滚动升级等场景中,需要使用新节点池替换旧节点池。在这些场景下,为做到业务不感知,可以在业务触发变更时,将业务的Pod软亲和调度到新的节点池上。 详情请参见节点池亲和性调度。 负载感知调度 提供节点CPU、Memory的负载感知调度能力,
registry-1.docker.io: no such host 解决方案: 可编辑yaml修改镜像地址,也可在工作负载详情页面更新升级页签单击更换镜像。 排查项三:使用错误的密钥(使用第三方镜像时) 通常第三方镜像仓库都必须经过认证(账号密码)才可以访问,而CCE中容器拉取镜像是使用