检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CPU和内存使用率。 云原生监控插件:使用Prometheus提供基础资源使用指标,需将Prometheus注册为Metrics API的服务,详见通过Metrics API提供基础资源指标。 安装插件 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”,在右侧
节点预绑定的容器网卡数=0。 网段规划建议 在集群网络构成中介绍集群中网络地址可分为集群网络、容器网络、服务网络三块,在规划网络地址时需要从如下方面考虑: 集群所在VPC下所有子网(包括扩展网段子网)不能和服务网段冲突。 保证每个网段有足够的IP地址可用。 集群网段的IP地址要与集群规模相匹配,否则会因为IP地址不足导致无法创建节点。
HPA伸缩范围。 前提条件 集群中已安装1.5.2及以上版本的CCE容器弹性引擎。 集群中已安装云原生监控插件,且开启监控数据上报至AOM服务,详情请参见云原生监控插件。 约束与限制 AHPA策略仅支持1.23及以上版本的集群。 1.19.10及以上版本集群中,如果使用HPA策略
Load Balancer的QPS、网站的实时在线人数等。社区经过思考之后,定义了一套标准的Metrics API,通过聚合API对外提供服务。 metrics.k8s.io: 主要提供Pod和Node的CPU和Memory相关的监控指标。 custom.metrics.k8s.io:
CPU和内存使用率。 云原生监控插件:使用Prometheus提供基础资源使用指标,需将Prometheus注册为Metrics API的服务,详见通过Metrics API提供基础资源指标。 集群中需要安装容器垂直弹性引擎。 注意事项 容器垂直伸缩功能目前处于试验阶段,请谨慎使用。
请不要操作任何命名空间下的default-secret、paas.elb。其中,default-secret用于SWR的私有镜像拉取,paas.elb用于该命名空间下的服务对接ELB。 使用密钥设置工作负载的环境变量 使用密钥配置工作负载的数据卷 本节以下面这个Secret为例,具体介绍Secret的用法。 apiVersion:
cce-gpu-topology-predicate true/false true 允许 CCE Standard/CCE Turbo 一台AI服务器上共有8块NPU 1980芯片,4P * 2方式。每4块NPU 1980芯片之间通过HCCS互联,4块之间通过PCIe swith互联。
exporter格式输出,有以下方式获取CCE容器网络扩展指标插件的监控信息: 直接访问CCE容器网络扩展指标插件提供的服务端口10001,形如http://{POD_IP}:10001/metrics 注意,如果在节点上访问插件服务端口,需要放通节点和Pod的安全组限制。 获取的监控信息示例如下: 示例1(IPv4发送公网报文数):
在EVS控制台扩容成功后,仅扩大了云硬盘的存储容量,还需要执行后续步骤扩容逻辑卷和文件系统。 登录CCE控制台,进入集群,在左侧选择“节点管理”,单击节点后的“同步云服务器”。 登录目标节点。 使用lsblk命令查看节点块设备信息。 这里存在两种情况,根据容器存储Rootfs而不同。 Overlayfs:没
的整体性能。 更多资料请查看社区NUMA亲和性插件指导链接:https://github.com/volcano-sh/volcano/blob/master/docs/design/numa-aware.md 前提条件 已创建一个CCE Standard集群或CCE Turbo