检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置案例2 随着集群状态,工作负载流量与请求的动态变化,节点的利用率也在实时变化,集群有可能会再次出现负载极端不均衡的情况,在业务Pod允许被驱逐重新调度的场景中,通过负载感知和热点打散重调度结合使用,可以获得集群最佳的负载均衡效果。关于热点打散重调度能力的使用请参见重调度(Descheduler)。
Worker之间的带宽直接影响了训练的效率。 Kubernetes默认调度器并不考虑Ps和Worker的这种逻辑关系,Ps和Worker是被随机调度的。如下图所示,2个TFJob(1个Ps + 2 Worker),使用默认调度器,有可能会出现(a)、(b)、(c)三种情况的任意一
容忍策略与节点的污点能力配合使用,允许(不强制)插件的 Deployment 实例调度到带有与之匹配的污点的节点上,也可用于控制插件的 Deployment 实例所在的节点被标记污点后插件的 Deployment 实例的驱逐策略。 插件会对实例添加针对node.kubernetes.io/not-ready和node
例如,存储卷名称前缀设置为“test”,则实际创建的底层存储名称test-{uid}。 访问模式 文件存储类型的存储卷仅支持ReadWriteMany,表示存储卷可以被多个节点以读写方式挂载,详情请参见存储卷访问模式。 加密 存储类为csi-nas时,可选择底层存储是否加密,使用加密时需要选择使用的加密密钥。
可以是: CURRENT这是使用的API的首选版本; SUPPORTED:这是一个较老的,但仍然支持的API版本; DEPRECATED:一个被废弃的API版本,该版本将被删除 updated String API发布时间(UTC格式)。例如API版本为v3时,值为'2018-09-15
设置云存储 在“服务配置”中单击添加服务,设置工作负载访问参数,设置完成后,单击“确定”。 本例中,将应用设置为“通过弹性公网IP的方式”被外部互联网访问。 Service名称:输入应用发布的可被外部访问的名称,设置为:apptest。 访问类型:选择“节点访问”。 服务亲和:
完成后,可在云原生成本治理的成本标签界面,看到CCE-Cluster-ID、CCE-Dynamic-Provisioning-Node标签被激活。 创建默认租户OBS桶:创建名称为cce-cost-{region}-{domain_id}的默认OBS桶,该OBS桶用来存储从费用中心导出的账单数据。
此可以将多个节点作为一个整体进行负载亲和性调度。 例如,某个拓扑域中的一个节点上运行着满足负载亲和性规则的Pod,则该拓扑域中的节点均可以被调度。 kubernetes.io/hostname 标签名 设置工作负载亲和/反亲和性时,填写需要匹配的工作负载标签。 该标签可以使用系统默认的标签,也可以使用自定义标签。
单AZ存储:数据仅存储在单个可用区(AZ),成本更低。 访问模式 对象存储类型的存储卷仅支持ReadWriteMany,表示存储卷可以被多个节点以读写方式挂载,详情请参见存储卷访问模式。 访问密钥(AK/SK) 自定义密钥:如果您需要为不同OBS存储分配不同的用户权限时,可通
如果实例运行所在的节点具有足够的可用资源,实例可以使用超出申请的资源量,但不能超过限制的资源量。 例如,如果您将实例的内存申请值为1GiB、限制值为2GiB,而该实例被调度到一个具有8GiB CPU的节点上,且该节点上没有其他实例运行,那么该实例在负载压力较大的情况下可使用超过1GiB的内存,但内存使用量不
cluster、docker build、docker API等功能,但也会引入一些bug,并且与Containerd相比,多了一层调用,因此Containerd被认为更加节省资源且更安全。 容器引擎版本说明 Docker EulerOS/CentOS:docker-engine 18.9.0,CCE定
一并释放,节点如果未到期CCE不会对其做任何操作,相关数据会继续保留,相关资源会继续计费。请关注您账号下到期未续费集群,及时续费,防止节点被重装导致数据丢失。 若订单中存在主从关系的资源,需分别进行退订。 资源退订,相关注意事项请参见退订规则说明。 如果您正在退订使用中的资源,请
如果节点池中没有满足条件的节点,Pod将无法被调度。 restricted:Pod调度时会选择拓扑管理策略已经设置为restricted节点池的节点,且CPU需要放置在相同的NUMA集合下,如果节点池中没有满足条件的节点,Pod将无法被调度。 best-effort:Pod调度时
容忍策略与节点的污点能力配合使用,允许(不强制)插件的 Deployment 实例调度到带有与之匹配的污点的节点上,也可用于控制插件的 Deployment 实例所在的节点被标记污点后插件的 Deployment 实例的驱逐策略。 插件会对实例添加针对node.kubernetes.io/not-ready和node
前往AOM查看自定义指标是否采集成功。 约束与限制 ICAgent兼容Prometheus的监控数据规范,Pod提供的自定义指标必须满足Prometheus的监控数据规范才能够被ICAgent采集,参见Prometheus监控数据采集说明。 ICAgent仅支持上报Gauge指标类型的指标。 ICAgent调用自定义指标的接口周期为1分钟,不支持修改。
backend 图2 拓扑域示意图 调度时,会根据prefer标签划分节点拓扑域,本示例中192.168.0.97和192.168.0.94被划作同一拓扑域。如果当拓扑域中运行着app=backend的Pod,即使该拓扑域中并非所有节点均运行了app=backend的Pod(本例该拓扑域中仅192
CustomedHPA策略仅支持1.15及以上版本的集群。 1.19.10以下版本的集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,当新Pod被调度到另一个节点时,会导致之前Pod不能正常读写。 1.19.10及以上版本集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,新Po
tus字段。 移除VG中相应PV。 VG信息会存在于相应的磁盘上: 当多块磁盘组成的VG缺少一部分时,会显示PV丢失。 当VG中仅有的磁盘被拔出时,vgdisplay将无法显示相应VG,通过vgdisplay无法查看到vg-everest-localvolume-persiste
节点池开启弹性伸缩 开启弹性伸缩后,节点池将根据集群负载情况自动创建或删除节点池内的节点。 节点池中的节点建议不要放置重要数据,以防止节点被弹性缩容,数据无法恢复。 节点池关闭弹性伸缩 关闭弹性伸缩后,节点池内节点数量不随集群负载情况自动调整。 / 调整节点池大小 支持直接调整节
为什么云原生监控插件开启本地数据存储时,重启kube-state-metrics实例可能会导致页面部分数据翻倍? 当kube-state-metrics实例被调度到一个新的节点上,kube-state-metrics采集的指标中的instance标签值就发生了变化。而由于本地存储了数据的机制,导致