在本文中使用的是VPC网络模型或容器隧道网络模型的CCE Standard集群。且在选择节点时,请注意新创建节点的内核版本必须为5.10及以上,因此本文使用的节点操作系统为Ubuntu 22.04。 准备一台可访问公网的虚拟机,使用kubectl连接集群并安装Helm。 步骤一:安装Service Mesh控制平面
metadata: labels: app: gpu-app spec: containers: - name: container-1 image: <your_image_address> # 请替换为您的镜像地址
用的资源进行调度,确保关键业务的资源优先级得到保障。 业务优先级保障调度 AI任务性能增强调度 根据AI任务的工作性质、资源的使用情况,设置对应的调度策略,可以增强集群业务的吞吐量,提高业务运行性能。 AI任务性能增强调度 NUMA亲和性调度 Volcano可解决调度程序NUMA拓扑感知的限制,实现以下目标:
Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息。 412 Precondition Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于
因此请务必在升级驱动前确认节点上不存在正在运行的任务。 步骤一:指定节点池驱动版本 登录节点查看节点上实际的驱动版本。不同版本的CCE AI套件(NVIDIA GPU)插件使用不同的命令查询驱动,具体如下: 1.x.x版本执行命令为: /opt/cloud/cce/nvidia/bin/nvidia-smi
请值和限制值的配置说明及建议请参见设置容器规格。 GPU配额(可选) 当集群中包含GPU节点时,才能设置GPU配额,且集群中需安装CCE AI套件(NVIDIA GPU)插件。 不使用:表示不使用GPU。 GPU 整卡:单个容器独享GPU。 GPU 虚拟化:容器需要使用的GPU百
和华为云服务如何使用KMS加密数据。 前提条件 请确保您已经在华为云DEW服务创建了KMS密钥,且密钥CCE集群同处于一个region。关于DEW密钥管理的更多信息和相关操作,请参见创建密钥。关于DEW服务计费的详细说明,请参见计费概述。 请确保您的账号已经对CCE服务授予cce
选择合适的节点数据盘大小 节点池日常管理实践 存储扩容 通过Core Dump文件定位容器问题 容器与节点时区同步 将节点容器引擎从Docker迁移到Containerd CCE节点安全配置建议 节点池弹性伸缩实践 使用HPA+CA实现工作负载和节点联动弹性伸缩 父主题: 节点池
nginx:v1 swr.cn-east-3.myhuaweicloud.com/container/nginx:v1 docker push swr.cn-east-3.myhuaweicloud.com/container/nginx:v1 使用相同的方法制作v2版本镜像并上传至镜像仓库。
例被ECS释放前5分钟收到通知,产生ReceivedReclaimNodeNotification事件,并给节点加污点node-problem-controller.cce.io/SpotPriceNodeReclaimNotification: NoExecute,驱逐节点上的
commands: NOTE: It may take a few minutes for the LoadBalancer IP to be available. Watch the status with: 'kubectl get svc --namespace default
io/eip-charge-mode: bandwidth # EIP计费模式 spec: containers: - name: container-0 image: nginx:alpine resources:
显示集群的节点子网。 子网是用来管理弹性云服务器网络平面的一个网络,可以提供IP地址管理、DNS服务,子网内的弹性云服务器IP地址都属于该子网。 默认情况下,同一个VPC的所有子网内的弹性云服务器均可以进行通信,不同VPC的弹性云服务器不能进行通信。 不同VPC的弹性云服务器可通过VPC创建对等连接通信。
态。需要了解的内容如表1。 表1 了解应用环境 类别 子类 说明 运行环境 操作系统 应用需要运行在什么操作系统上,比如centos或者Ubuntu。 本例中,应用需要运行在centos:7.1操作系统上。 运行环境 java应用需要jdk,go语言需要golang,web应用需
弹性云服务器”。 在左侧导航树中,选择“密钥对”。 单击“创建密钥对”,并按照提示完成创建,详情请参见密钥对。 创建完成后,系统生成密钥文件,自动保存在系统默认目录下。 父主题: 附录
确地址。 通过以下命令下载最新的二进制文件。 x86系统 curl -k "https://{您获取的obs地址}/cluster-versions/base/cce-agent" > /tmp/cce-agent ARM系统 curl -k "https://{您获取的obs地
业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务
云容器实例CCI服务上,以减少集群扩容带来的消耗。 前提条件 使用插件前需要用户在CCI界面对CCI服务进行授权。 如果使用CCI 2.0服务对接CCE突发弹性引擎(对接 CCI)请先完成环境设置。 当前CCI 2.0服务处于公测阶段,如需使用CCI 2.0服务请联系客服进行开通。
个拓扑域中仅包含一个节点,因此可以实现单个节点级别的负载亲和性调度。 如果指定标签为kubernetes.io/os,此时标签值为节点的操作系统类型,则将不同操作系统的节点划分为不同的拓扑域,此时一个拓扑域中可能包含多个节点,因此可以将多个节点作为一个整体进行负载亲和性调度。 例
app: nginx version: v1 spec: containers: - name: container-1 image: nginx:latest volumeMounts:
您即将访问非华为云网站,请注意账号财产安全