检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对于已存在的节点池,升级为新节点池后将存在以下行为变更: 原节点池类型 新节点池变化 按需节点池 新节点池将自动继承按需节点池的全量能力。 此外,新节点池中创建的包周期节点不支持手动缩容,仅支持退订和移除。 包周期节点池 您可以将原有的包周期节点池无损切换到新节点池,并且不会对节点池下已有的节点产生任何影响。
5及以上版本的云原生监控插件,且部署模式需选择“本地数据存储”。 采集GPU指标 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“配置项与密钥”。 切换至“monitoring”命名空间,在“配置项”页签找到user-adapter-config配置项,并单击“更新”。 图1 更新配置项 在“配置数据”中单击config
检查升级节点是否成功。 变更控制节点规格失败 Failed to change flavor of the master 重要 检查变更控制节点规格是否成功。 变更控制节点规格超时 Change flavor of the master timeout 重要 检查变更控制节点规格是否超时。
节点数应大于CoreDNS副本数,避免单个节点上运行多个CoreDNS副本。 登录CCE控制台,进入集群,单击左侧导航栏的“节点管理”。 切换至“节点”页签,选择CoreDNS需要独占的节点,单击“标签与污点管理”。 添加以下标签: 标签键:node-role.kubernetes
件,开启“监控数据上报至AOM服务”,并选择“指标上报的AOM实例”。其余配置详情请参见云原生监控插件。 在左侧导航栏中选择“配置中心”,切换至“监控运维配置”页签。 在“采集配置”中找到“ServiceMonitor”,单击“管理”。 搜索DCGM-Exporter组件的“ServiceMonitor”并开启。
根据需求选择其他必选参数后,单击“安装”。关于参数的详细说明请参见NGINX Ingress控制器。 配置下发完成后,在左侧导航栏中选择“服务”,并切换至“kube-system”命名空间,查看插件对接的监听器端口协议,本示例中为HTTP和HTTPS,而不是TCP协议。 父主题: Nginx
集群中需要同时安装CCE AI套件(NVIDIA GPU)插件和Volcano调度器插件。 登录CCE控制台,单击集群名称进入集群,在左侧选择“配置中心”。 切换至“异构资源配置”页签,开启“GPU虚拟化”。 集群默认驱动:集群中GPU节点默认使用的GPU驱动版本。如果选择“自定义驱动链接地址”,则
在左侧导航栏中选择“服务”,切换至“路由”页签,单击右上角“创建路由”,创建名为origin-ingress的Ingress,并关联刚创建的origin-service服务。参数配置说明请参见通过控制台创建ELB Ingress。 灰度发布新版本服务。 在左侧导航栏中选择“服务”,切换至“路由”页
cpu. 容器日志查看方法 登录CCE控制台。 单击集群名称进入集群,在左侧选择“工作负载”。 单击工作负载操作列的“日志”。 您可以在日志上方切换实例和容器。 Pod监控检查方法 登录CCE控制台。 单击集群名称进入集群,在左侧选择“工作负载”。 单击工作负载操作列的“监控”,即可查
移不敏感,因此无需任何干预即可正常工作。有些应用对CPU敏感,CPU敏感型应用有如下特点。 对CPU throttling 敏感 对上下文切换敏感 对处理器缓存未命中敏感 对跨Socket内存访问敏感 期望运行在同一物理CPU的超线程 如果您的应用有以上其中一个特点,可以利用Ku
rstable Pod(要求CPU的requests和limits参数值都是正整数)优先使用某些CPU的能力,以减少应用在多个CPU间频繁切换带来的影响。能够优先使用CPU的Burstable Pod举例如下: ... spec: containers: - name: nginx
nginx-elb-svc.yaml 配置验证 登录ELB控制台,查看Service对应的ELB(本示例中名为james)。 单击ELB名称,并切换至“监控”,可以看到ELB的连接数为0。 使用kubectl命令行登录集群中的任意一个Nginx容器中,然后访问ELB的地址。 查询集群中的Nginx容器。
Deleting:删除中,表示集群正处于删除过程中。 Upgrading:升级中,表示集群正处于升级过程中。 Resizing:规格变更中,表示集群正处于变更规格中。 ResizeFailed:规格变更异常,表示集群变更规格异常。 RollingBack:回滚中,表示集群正处于回滚过程中。 RollbackFailed:回滚异常,表示集群回滚异常。
通过控制台操作 通过kubectl命令行操作 通过API操作 登录CCE控制台,单击集群名称进入集群。 在集群控制台左侧导航栏中选择“节点管理”,切换至“节点”页签。 找到目标节点,单击节点后的“更多 > 节点排水”。 在弹出的“节点排水”窗口中,进行排水设置。 超时时间(秒):超过设定
nginx-elb-svc.yaml 配置验证 登录ELB控制台,查看Service对应的ELB(本示例中名为james)。 单击ELB名称,并切换至“监控”,可以看到ELB的连接数为0。 使用kubectl命令行登录集群中的任意一个Nginx容器中,然后访问ELB的地址。 查询集群中的Nginx容器。
在管理控制台左上角单击图标,选择区域和项目。 选择“服务列表 > 网络 > 弹性负载均衡 ELB”。 在“弹性负载均衡器”界面,单击需要操作的负载均衡名称。 切换到“监听器”页签,单击需要修改的监听器名称右侧的“编辑”按钮。如果存在修改保护,请在监听器基本信息页面中关闭修改保护后重试。 开启“获取客户端IP”开关。
导航栏中选择“插件中心”,在右侧找到CoreDNS域名解析插件,单击“编辑”。 在“参数配置”中,选择是否切换Corefile视图(1.30.3及以上版本的插件支持)。 切换后将通过Corefile格式直接配置kube-system命名空间下的CoreDNS的ConfigMap,且已有的存根域配置和高级配置内
Deleting:删除中,表示集群正处于删除过程中。 Upgrading:升级中,表示集群正处于升级过程中。 Resizing:规格变更中,表示集群正处于变更规格中。 ResizeFailed:规格变更异常,表示集群变更规格异常。 RollingBack:回滚中,表示集群正处于回滚过程中。 RollbackFailed:回滚异常,表示集群回滚异常。
工作负载列表页面呈现了所有工作负载的综合信息,如需深入了解单个工作负载的监控情况,可单击工作负载名称,进入该工作负载的“概览”页面,通过切换“Pod列表”、“监控”页签查看相应内容。 工作负载列表 工作负载列表中包含工作负载名称、状态、Pod个数(正常/全部)、命名空间、镜像名
基于本地存储的传统模式与Prometheus插件类似,数据存储于集群内,消耗较多的计算和存储成本并无法支撑多于400节点的大规模集群。 我们更推荐您切换为本地存储的轻量化模式,将监控数据对接至AOM并按需废弃自定义指标,从成本和可靠性角度来看,是更优的选择。 前提条件 集群版本为v1.21。