检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数在50及以下该值会被隐式重设为 0) 配置建议: 配合node-eviction-rate设置,一般建议设置为node-eviction-rate的十分之一 区域亚健康场景迁移速率设置过大无实际意义,且可能引入集群过载风险 父主题: 集群
使用nginx:exporter创建工作负载。 登录到容器中,并通过http://<ip_address>:8080/stub_status获取到nginx的监控数据,其中<ip_address>为容器的IP地址,监控数据如下所示。 # curl http://127.0.0.1:8080/stub_status
取值范围: 高于集群当前版本的可用集群版本 skippedCheckItemList 否 Array of skippedCheckItemList objects 参数解释: 跳过检查的项目列表 约束限制: 不涉及 取值范围: 不涉及 表4 skippedCheckItemList 参数
务资源(例如云硬盘、绑定的弹性IP、带宽等)将按各自的计费方式(“包年/包月”或“按需付费”等)进行收费。 说明: 集群休眠后,集群中的工作节点(即ECS)并不会自动关机,如需关机可勾选“关机集群下所有节点”选项。您也可以在集群休眠后自行登录ECS控制台将节点关机,具体请参见节点关机。
io/elb.id","kubernetes.io/elb.pass-through" loadBalancerIP 否 String service对接ELB时的ELB IP。 表9 metrics配置 参数 是否必选 参数类型 描述 enable 否 bool 是否指标监控,默认true。
-f nginx-emptydir.yaml 本地临时卷异常处理说明 用户如果手动从ECS侧卸盘、手动执行vgremove两种误操作致临时卷存储池异常。可以先将节点设置为不可调度,具体方法请参见一键设置节点调度策略,然后通过重置节点进行恢复。 父主题: 临时存储卷(EmptyDir)
<none> ... 一键设置节点调度策略 您可以通过控制台将节点设置为不可调度,系统会为该节点添加键为node.kubernetes.io/unschedulable,效果为NoSchedule的污点。节点设置为不可调度后,新的Pod将无法调度至该节点,节点上已运行的Pod则不受影响。
在“容器配置>基本信息”中设置xGPU配额: 显存:显存值单位为MiB,需为正整数,且为128的倍数。若配置的显存超过单张GPU卡的显存,将会出现无法调度状况。 算力:算力值单位为%,需为5的倍数,且最大不超过100。 当显存设置为单张GPU卡的容量上限或算力设置为100%时,将会使用整张GPU卡。
登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”。 在“插件中心”页面右侧找到云原生监控插件,单击“安装”。 建议您关注以下配置,其他配置可按需进行设置。详情请参见云原生监控插件。 本地数据存储:使用本地存储监控数据,监控数据可选择是否上报至AOM或三方监控平台。 自定义指标采集:该配置在
制: 设置了enforce隔离模式对应的策略为privileged,将会跳过enforce阶段的校验。 设置了audit隔离模式对应的策略为baseline,将会校验baseline策略相关限制,即如果Pod或Container违反了该策略,审计日志中将添加相应事件。 设置了wa
key: LS0tL******0tLS0K kind: Secret metadata: annotations: description: test for ingressTLS secrets name: ingress-test-secret namespace:
ScaleNodePoolRequestBody(); List<String> listSpecScaleGroups = new ArrayList<>(); listSpecScaleGroups.add("default"); ScaleNodePoolSpec
漏洞影响 集群使用了聚合API,只要kube-apiserver与聚合API server的网络直接连通,攻击者就可以利用这个漏洞向聚合API服务器发送任何API请求; 如果集群开启了匿名用户访问的权限,则匿名用户也利用这个漏洞。不幸的是Kubernetes默认允许匿名访问,即kube-apiserver的启动参数”--
一般集群内节点数量快占满容器网段场景下会出现该问题。例如,容器网段为10.0.0.0/16,可用IP数量为65536,VPC网络IP分配是分配固定大小的网段(使用掩码实现,确定每个节点最多分配多少容器IP),例如上限为128,则此时集群最多支持65536/128=512个节点,然后去掉Master节点数量为509,此时是1
metadata: name: tfjob-simple namespace: kubeflow spec: tfReplicaSpecs: Worker: replicas: 2 restartPolicy: OnFailure template:
节点操作系统 集群版本与操作系统对应关系 如下为当前已经发布的集群版本与操作系统版本的对应关系,请参考: 表1 弹性云服务器-虚拟机节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型 云原生网络2
problem_gauge{type="CNIProblem"} >= 1 节点CRI组件异常 检查关键组件CRI(容器运行时组件)Docker或Containerd的运行状态 指标类 云原生监控插件 节点故障检测插件 problem_gauge{type="CRIProblem"} >= 1 节点Kube-proxy故障
21.11-r40、v1.23.8-r0、v1.25.6-r0、v1.27.3-r0及以上时,取值范围调整为0-100000 说明: 该参数设置为0时,表示保留所有终止状态的Pod。 1000 允许 CCE Standard/CCE Turbo 配置建议: 1000 配置过大集群可
object 插件规格参数 custom 是 表3 object 插件自定义参数 表2 flavor 参数 是否必选 参数类型 描述 description 否 String 插件相关的描述信息 name 是 String 插件规格名称,固定为:Single-instance replicas
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 package com.huaweicloud