检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
com/gpu为整数,将使用整卡资源。如果在开启GPU虚拟化前工作负载中已经使用nvidia.com/gpu资源,则不会转成虚拟化GPU,依然使用整卡资源。 开启GPU虚拟化时,在工作负载中设置nvidia.com/gpu等价于开启虚拟化GPU显存隔离,可以和显存隔离模式(即设置volcano.sh/gpu-mem
节点级别,容器隧道网络最大可支持2000节点规模。 容器IP地址管理 容器隧道网络按如下规则分配容器IP: 容器网段独立于节点网段进行单独设置。 按节点维度划分地址段,集群的所有节点从容器网段中分配一个或多个固定大小(默认16)的IP网段。 当节点上的IP地址使用完后,可再次申请分配一个新的IP网段。
休眠/唤醒按需计费集群 操作场景 当按需计费的集群暂时不需要使用时,您可以将其设置为休眠状态,有助于节省成本并减少资源浪费。 集群休眠后,将无法在此集群上创建和管理工作负载等资源。 注意事项 集群唤醒过程中,可能会由于资源不足导致Master节点启动失败,从而导致集群唤醒失败,请过一段时间再次唤醒。
单张GPU卡的显存,将会出现无法调度状况。 算力:算力值单位为%,需为5的倍数,且最大不超过100。 当显存设置为单张GPU卡的容量上限或算力设置为100%时,将会使用整张GPU卡。 使用GPU虚拟化时,工作负载调度器将默认指定为Volcano且不可更改。 图1 设置xGPU配额
如果您需要使用指定的NVIDIA驱动版本,可以在节点安装新版本GPU驱动,操作步骤如下: 对节点下线,并将节点上的负载进行手动驱逐,结束所有程序对GPU卡的使用。 节点下线 kubectl cordon <NODE_NAME> 下线后对应节点状态变成不可调度 NAME STATUS
CCE是否有DNS服务? 如果工作负载不需要使用集群内的CoreDNS,如何设置? 如何解读和修改Resolv.conf? 域名解析失败,如何处理? 更多 节点类 集群状态为“可用”,节点状态为“不可用”,如何处理? 无法远程登录节点,怎么办? 如何解决yum update升级操作系统导致容器网络不可用问题?
集群外部访问Ingress异常 CCE集群中域名解析失败 为什么访问部署的应用时浏览器返回404错误码? 为什么容器无法连接互联网? VPC的子网无法删除,怎么办? 如何修复出现故障的容器网卡? 节点无法连接互联网(公网),如何排查定位? 如何解决VPC网段与容器网络冲突的问题? ELB四层健康检
的“IPv6网卡”页签,可以看到所属实例为“云容器引擎”的IPv6双栈网卡,请勿在页面上直接移除或调用VPC的API移除,以免影响您的业务。 通过控制台设置 您可以在创建工作负载时,选择“高级配置 > 网络配置”设置IPv6共享带宽。 通过kubectl命令行设置 您可以通过对D
准备GPU虚拟化资源 CCE GPU虚拟化采用自研xGPU虚拟化技术,能够动态对GPU设备显存与算力进行划分,单个GPU卡最多虚拟化成20个GPU虚拟设备。本文介绍如何在GPU节点上实现GPU的调度和隔离能力。 前提条件 配置 支持版本 集群版本 v1.23.8-r0、v1.25
监控级别 备注 cce_npu_memory_total NPU卡 NPU卡显存总量 cce_npu_memory_used NPU卡 NPU卡显存使用量 cce_npu_utilization NPU卡 NPU卡算力使用率 如何确认节点NPU驱动已安装完成 NPU驱动安装成功后
图1 podSelector 目标Pod具有role=db标签,该Pod只允许带有role=frontend标签的Pod访问其6379端口。设置该网络策略的具体操作步骤如下: 创建名为access-demo1.yaml文件。 vim access-demo1.yaml 以下为YAML文件内容:
登录集群查看告警节点状态,确认异常后,优先将此节点设置为不可调度,并将业务pod调度到其他节点 节点的连接跟踪表已满 CCE 节点异常立即触发告警 登录集群查看告警节点状态,确认异常后,优先将此节点设置为不可调度,并将业务pod调度到其他节点 节点池资源售罄 CCE 节点池资源售罄立即告警 设置自动节点池切换或更换节点池规格
云容器引擎为满足多种复杂场景下工作负载间的互相访问,提供了不同的访问方式,从而满足不同场景提供不同访问通道。详情请参考网络概述设置公网访问。 我有多个工作负载(在同个集群中),它们之间需要互相访问,应该怎么办? 集群内访问表示工作负载暴露给同一集群内其他工作负载访问的方式,可以通过“集群内部域名”访问。
填写节点池配置。 节点类型:选择节点类型 节点规格:2核 | 4GiB 其余参数设置可使用默认值,详情请参见创建节点池。 节点池创建完成后,在目标节点池所在行右上角单击“弹性伸缩”,设置弹性伸缩配置。关于节点伸缩策略设置的详细说明,请参见创建节点伸缩策略。 若集群中未安装CCE集群弹性引擎
默认数据盘:单击后方的“展开高级配置”可设置数据盘空间分配,对数据盘上存在的容器引擎、镜像、临时存储等进行空间划分,避免因磁盘空间不足导致业务异常。数据盘空间分配详细说明请参见默认数据盘空间分配说明。 其他普通数据盘:单击后方的“展开高级配置”,可选择挂载设置。 默认:挂载为裸盘,不做任何设置。 挂载到指定
节点云服务器使用的系统盘,供操作系统使用。您可以设置系统盘的规格为40GiB-1024GiB之间的数值,缺省值为50GiB。 说明: 通用型SSD V2支持自定义设置IOPS和吞吐量,极速型SSD V2支持自定义设置IOPS,设置范围参见云硬盘性能数据表。仅v1.21.15-r0、v1
Ingress为例进行说明。 登录CCE控制台,单击集群名称进入集群。 选择左侧导航栏的“服务”,在右侧选择“路由”页签,单击右上角“创建路由”。 设置Ingress参数。 名称:自定义Ingress名称,例如nginx-ingress-demo。 命名空间:选择需要添加Ingress的命名空间。
新建节点时,数据盘如需分配用户空间,分配目录注意不要设置关键目录,例如:如需放到home下,建议设置为/home/test,不要直接写到/home/下。 请注意“挂载路径”不能设置为根目录“/”,否则将导致挂载失败。挂载路径一般设置为: /opt/xxxx(但不能为/opt/cloud)
VPC网络模型将虚拟私有云VPC的路由方式与底层网络深度整合,适用于高性能场景,但节点数量受限于虚拟私有云VPC的路由配额。在VPC网络模型中,容器网段独立于节点网段进行单独设置。在容器IP地址分配时,集群中的每个节点会被分配固定大小的容器IP地址段,用于给该节点上运行的容器分配容器IP。由于VPC网络模型没有隧道
inner/public inner 允许 CCE Standard/CCE Turbo 设置负载均衡器支持的网络类型,设置为inner,负载均衡器只支持ipv4私网;设置pulic,负载均衡器支持ipv4私网和ipv4公网。设置public会创建对应的弹性公网ip,并收取一定费用。 配置建议: 需