检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点操作系统 集群版本与操作系统对应关系 如下为当前已经发布的集群版本与操作系统版本的对应关系,请参考: 表1 弹性云服务器-虚拟机节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型 云原生网络2
集群类型:CCE Standard集群或CCE Turbo集群。 节点OS:Huawei Cloud EulerOS 2.0 节点类型:x86架构的弹性虚拟机。 Volcano插件版本:1.10.0及以上版本。 使用限制 使用超卖特性时,需保证Volcano未启用overcommit插件。 运
密钥对用于远程登录节点时的身份认证。若没有密钥对,可单击选项框右侧的“创建密钥对”来新建,创建密钥对操作步骤请参见创建密钥对。 使用镜像密码(当节点类型为弹性云服务器虚拟机或物理机,且操作系统选择私有镜像时支持) 保留所选择镜像的密码。为了保证您的正常使用,请确保所选择镜像中已经设置了密码。 存储配置 配置
Turbo集群时会额外创建一个ENI的安全组,名为{集群名}-cce-eni-{随机ID}。 用户可根据安全需求,登录CCE控制台,单击服务列表中的“网络 > 虚拟私有云 VPC”,在网络控制台单击“访问控制 > 安全组”,找到集群对应的安全组规则进行修改和加固。 如集群在创建时需要指定节点安全组,请
attern 与canary-by-header-value类似,唯一区别是该annotation用正则表达式匹配请求头的值,而不是某一个固定值。如果该annotation与canary-by-header-value同时存在,该annotation将被忽略。 nginx.ingress
Exporter为社区开源组件,因此本实践仅适用于监控Kubernetes社区原生的GPU资源(nvidia.com/gpu),不支持监控CCE提供的GPU虚拟化资源。 前提条件 目标集群已创建,且集群中包含GPU节点,并已运行GPU相关业务。 在集群中安装CCE AI 套件 (NVIDIA GPU)和云原生监控插件。
- name: 'cce-gpu-topology-priority' - name: 'cce-gpu' xgpu 支持GPU虚拟化资源分配。 - - plugins: - name: 'cce-gpu-topology-predicate' - name:
是否必选 描述 storage 是 PVC申请容量,单位为Gi。 对文件存储来说,此处仅为校验需要(不能为空和0),设置的大小不起作用,此处设定为固定值1Gi。 storageClassName 是 存储类名称。 csi-sfs:推荐使用,表示使用通用文件系统(SFS 3.0)。 csi-nas:表示使用SFS
d}。 storage 是 PVC申请容量,单位为Gi。 对对象存储来说,此处仅为校验需要(不能为空和0),设置的大小不起作用,此处设定为固定值1Gi。 storageClassName 是 存储类名称,对象存储对应的存储类名称为csi-obs。 执行以下命令,创建PVC。 kubectl
r实现ELB指标监控,如您需要自行开发exporter,请参见附录:自行开发一个exporter。 登录一台可访问公网且安装Docker的虚拟机,编写Dockerfile。 vi Dockerfile Dockerfile内容如下: FROM ubuntu:18.04 RUN apt-get
请排查yaml文件中是否存在imagePullSecrets字段。 排查事项: 当Pull SWR容器镜像仓库的镜像时,name参数值需固定为default-secret。 apiVersion: extensions/v1beta1 kind: Deployment metadata:
String 与canary-by-header-value类似,唯一区别是该annotation用正则表达式匹配请求头的值,而不是某一个固定值。如果该annotation与canary-by-header-value同时存在,该annotation将被忽略。 nginx.ingress
SecretProviderClass metadata: name: spc-test spec: provider: cce # 固定为cce parameters: objects: | - objectName: "secret_1"
个模块提供了基本的监控功能,通过在nginx.conf的配置可以提供一个对外访问Nginx监控数据的接口。 登录一台可连接公网的Linux虚拟机,且要求可执行Docker命令。 创建一个nginx.conf文件,如下所示,在http下添加server配置即可让nginx提供对外访问的监控数据的接口。
并定期审视,防止在应用运行过程中出现配额不足的瓶颈导致扩缩容失败。 云服务配额:使用CCE时也会使用其他云服务,包括弹性云服务器、云硬盘、虚拟私有云、弹性负载均衡、容器镜像服务等。如果当前资源配额限制无法满足使用需要,您可以提交工单申请扩大配额。 集群配额:集群中支持设置命名空间
utoscaler插件被卸载后,如果节点上依然存在该污点请您手动进行删除。 约束与限制 安装时请确保集群具有足够的资源。 该插件功能仅支持虚拟机节点,不支持物理机节点和裸金属服务器。 默认节点池不支持弹性扩缩容,详情请参见默认节点池DefaultPool说明。 缩容节点会导致与节
v1.17 v1.19 v1.21 v1.23 新增beta检查项ScheduledEvent,支持通过metadata接口检测宿主机异常导致虚拟机进行冷热迁移事件。该检查项默认不开启。 0.8.10 1.16.3 v1.17 v1.19 v1.21 v1.23 新增ResolvConf配置文件检查。
关闭GPU共享时,需保证集群中的Pod没有使用共享GPU能力(即Pod不存在cce.io/gpu-decision的annotation),并需保证关闭GPU虚拟化功能。 开启GPU共享时,需保证集群中已使用GPU资源的Pod均存在cce.io/gpu-decision的annotation。 默认:开启
tainer runtime等)预留内存资源。 evictionHard 硬驱逐配置项 memory.available 节点可用内存值 固定为100Mi 关于节点压力驱逐详情请参考节点压力驱逐。 须知: 驱逐配置项相关配置请谨慎修改,不合理的配置可能会导致节点频繁触发驱逐或节点已过载但未触发驱逐。
除。 说明: 删除子目录时,仅删除PVC参数中设置的子目录绝对路径,不会级联删除上层目录。 everest.io/volume-as 否 固定取值为“absolute-path”,表示使用动态创建SFS Turbo子目录。 集群中需安装2.3.23及以上版本的Everest插件。