检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在集群中安装云原生监控插件,采集Prometheus监控数据。 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”。 在“插件中心”页面右侧找到云原生监控插件,单击“安装”。 建议您关注以下配置,其他配置可按需进行设置。详情请参见云原生监控插件。 监控数据上报至A
前提条件 使用CustomedHPA策略必须安装CCE容器弹性引擎,若该插件版本低于1.2.11,则必须安装prometheus插件;若插件版本大于或等于1.2.11,则需要安装能够提供Metrics API的插件,您可根据集群版本和实际需求选择其中之一: Kubernetes Metrics
Prometheus指标上报参数,值为true表示当前负载开启上报。 具体使用请参见使用云原生监控插件监控自定义指标。 - prometheus.io/path Prometheus采集的url路径。 具体使用请参见使用云原生监控插件监控自定义指标。 /metrics prometheus.io/port
运维层面 集群运维能力 集群安全组配置正确性 集群资源规划合理性 租户配额是否充足 资源与业务层面 存储插件(everest)健康程度 日志采集插件(log-agent)健康程度 域名解析插件(coredns)健康程度 业务节点负载情况 业务节点状态 Pod配置健康程度 Pod负载情况 Pod运行状态
Ingress时,需在集群中提前安装NGINX Ingress 控制器,具体操作可参考安装插件。 约束与限制 不建议在ELB服务页面修改ELB实例的任何配置,否则将导致服务异常。如果您已经误操作,请卸载Nginx Ingress插件后重装。 Ingress转发策略中注册的URL需与后端应用提供访问的URL一致,否则将返回404错误。
划好各可用区节点资源,保证各可用区有足够的节点资源供实例部署(当单可用区的插件实例大于1时,建议各可用区可供插件实例可调度的节点数超过该可用区下实际插件实例数量1个以上),避免部分可用区节点资源不足阻塞插件实例的部署及更新过程中的整体调度。 均分模式在容灾要求较高场景推荐使用。 设置容器健康检查
CCE插件采用Helm模板方式部署,修改或升级插件请从插件配置页面或开放的插件管理API进行操作。请勿直接后台修改插件相关资源,以免插件异常或引入其他非预期问题。 CCE集群配额限制 针对每个用户,云容器引擎的集群在每个地域分配了固定配额。 限制项 普通用户限制 例外 实名认证 实名认证
可能填满节点,将应用负载靠拢在部分节点,这非常有利于集群节点的自动扩缩容功能。 Binpack为调度器的多个调度插件之一,与其他插件共同为节点打分,用户可以自定义该插件整体权重和各资源维度打分权重,用以提高或降低Binpack在整体调度中的影响力。调度器在计算Binpack策略得
通过binpack.resources添加自定义资源(GPU),并设定权重值为10 提高binpack插件的打分权重值后,该插件对于节点选择的影响力提高,nodeorder等插件对于节点的打分影响力将会被削弱 负载感知调度 Volcano调度器提供节点CPU、Memory的负载感
更新驱动版本后,新建节点直接生效,存量节点需重启节点生效。 安装2.7.2及以上版本的GPU插件时,支持以节点池级别配置XGPU虚拟化开关。 NPU配置 当不开启驱动选择时,无法根据用户诉求指定驱动版本,无法依靠插件进行驱动维护。如从控制台创建NPU节点,控制台会自动补充NPU驱动(用户无法指
Controller由社区开源的插件提供,需要在集群中安装插件自行运维;而ELB型的Ingress Controller运行在master节点上,由专门的华为云团队负责运维,无需用户保证。 如果您使用Nginx类型的Ingress,需要在集群中安装nginx-ingress插件。如果您使用ELB型的Ingress,则无需检查此步骤。
String 用户节点ID 表22 addonRisks 参数 参数类型 描述 addonTemplateName String 插件模板名称 alias String 插件别名 请求示例 集群升级前检查请求体 POST /api/v3/projects/{project_id}/clust
belet)不一致,使用第三方CSI插件的容器挂载路径为社区路径,会导致文件挂载不生效。 例如,vault开源三方插件在使用secrets-store-csi-driver挂载密钥时,如果插件的root-dir地址与CCE配置路径不一致(插件默认value值与社区地址一致:/va
可配置、支持容器mount F2FS&OverLayFS文件系统 商用 12 若干插件适配1.19版本集群及新增特性 插件市场中的若干插件支持在Kubernetes 1.19版本集群下使用,部分插件在功能方面进行增强。 商用 2020年11月 序号 功能名称 功能描述 阶段 相关文档
容灾 CCE集群高可用推荐配置 在CCE中实现应用高可用部署 插件高可用部署
如果节点驱动版本为460系列,请升级驱动至460.32.03版本。 如果您升级CCE集群节点的GPU驱动,可以升级gpu-beta插件或重装插件,并在安装插件时填写修复后的NVIDIA GPU驱动的下载地址即可。 相关链接 英伟达安全公告:https://nvidia.custhelp
指标采集:CCE提供基于Prometheus的云原生监控插件,相比于开源版本,具备轻量化,开箱即用等优势。详情请参见云原生监控插件。 日志采集:CCE提供基于fluent-bit和opentelemetry的云原生日志采集插件,具备高性能,资源占用低的优点;同时支持基于CRD的日志
收集容器日志 通过云原生日志采集插件采集容器日志 通过ICAgent采集容器日志(不推荐) 父主题: 日志中心
产品发布记录 集群版本发布记录 操作系统镜像发布记录 插件版本发布记录
集群升级 CCE集群升级时,升级集群插件失败如何排查解决? 父主题: 集群