检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
检查步骤 业务不同,验证的方式也有所不同,建议您在升级前确认适合您业务的验证方式,并在升级前后均执行一遍。 常见的业务确认方式有: 业务界面可用 监控平台无异常告警与事件 关键应用进程无错误日志 API拨测正常等 解决方案 若集群升级后您的在线业务有异常,请联系技术支持人员。 父主题: 升级后验证
云原生告警是可观测性体系里面比较重要的一环。在云原生告警中,除了传统的CPU、内存等资源使用量的告警以外,还有容器重启等事件告警、应用访问失败等自定义的监控指标告警。 CCE的云原生告警能力是由AOM服务提供的,支持指标和事件的告警。同时,CCE集群详情中增加了告警中心能力,能支持快速配置资源等常用告警和告警查看。
存使用率等等。而这些数据的监控能力Kubernetes也没有自己实现,而是通过其他项目来扩展Kubernetes的能力,Kubernetes提供Prometheus和Metrics Server插件来实现该能力: Prometheus是一套开源的系统监控报警框架,能够采集丰富的M
集群系统密钥说明 CCE默认会在每个命名空间下创建如下密钥。 default-secret paas.elb default-token-xxxxx(xxxxx为随机数) 下面将详细介绍这个几个密钥的用途。 default-secret default-secret的类型为kubernetes
可观测性 监控中心 日志中心 告警中心
插件 CoreDNS域名解析 CCE容器存储插件(Everest) Kubernetes Metrics Server 云原生监控插件 云原生日志采集插件 NGINX Ingress控制器 CCE容器弹性引擎
27.3-r30 v1.27.4 - 支持一键配置监控告警。 修复部分安全问题。 v1.27.3-r20 v1.27.4 支持安装NGINX Ingress控制器插件。 支持安装云原生监控插件以及云原生日志插件,实现对应用指标的监控以及应用日志采集。 支持应用模板市场。 支持自定义资源(CRD)的使用。
显著降低了运维成本。且对互联网金融等对安全合规性有严格要求的行业,传统驾驶模式客户自运维,OS等保能力建设困难,CCE Autopilot集群的托管服务不仅简化了节点管理,还提升了系统的安全性和合规性,使企业能够更专注于核心业务的创新与发展。 图1 传统模式和自动驾驶的资源管理对比
使用HPA需要安装能够提供Metrics API的插件: Kubernetes Metrics Server:提供基础资源使用指标,例如容器CPU和内存使用率。 云原生监控插件: 根据基础资源指标进行弹性伸缩:需将Prometheus注册为Metrics API的服务,详见通过Metrics API提供资源指标。
Autopilot集群负责节点扩缩容及预热。 工作节点由您自行管理、运维 工作节点由您自行管理、运维 节点操作系统 使用containerd容器引擎的专属操作系统 您可以自行选择操作系统及容器引擎 您可以自行选择操作系统及容器引擎 节点规格 自适应规格 由您选择指定的节点规格 由您选择指定的节点规格 节点升级和维护
默认使用所选的VPC中已有的终端节点,否则系统将为您新建SWR和OBS的终端节点。 终端节点将产生一定费用,详情请参见价格计算器。 配置SNAT 开启后您的集群可以通过NAT网关访问公网,默认使用所选的VPC中已有的NAT网关,否则系统将会为您自动创建一个默认规格的NAT网关并绑定弹性公网IP,自动配置SNAT规则。
和授权项。 如表1所示,包括了CCE的所有系统权限。 表1 CCE系统权限 系统角色/策略名称 描述 类别 依赖关系 CCE Administrator 具有CCE集群及集群下所有资源(包含集群、工作负载、任务、服务等)的读写权限。 系统角色 拥有该权限的用户必须同时拥有以下权限:
一: Kubernetes Metrics Server:提供基础资源使用指标,例如容器CPU和内存使用率。所有集群版本均可安装。 云原生监控插件:根据基础资源指标进行弹性伸缩,需将Prometheus注册为Metrics API的服务,详见通过Metrics API提供资源指标。
原生容器存储系统,基于CSI(即Container Storage Interface)为Kubernetes集群对接云存储服务的能力。 v1.27.5-r0、v1.28.3-r0及以上版本的集群中,该插件由系统自动配置,无需手动安装或更新。 编辑插件 本插件为系统默认安装,若需自定义参数,可参照如下步骤进行编辑。
rometheus-operator和Prometheus,提供简单易用的端到端Kubernetes集群监控能力。*注意:kube-prometheus-stack为系统监控插件,当集群资源不足时,Kubernetes会优先保证插件pod的调度。" },
PC中已有的终端节点,否则系统将为您新建SWR和OBS的终端节点。 终端节点将产生一定费用,详情请参见价格计算器(VPC终端节点)。 配置SNAT 开启 默认开启,开启后您的集群可以通过NAT网关访问公网。默认使用所选的VPC中已有的NAT网关,否则系统将会为您自动创建一个默认规
在对象存储服务etcd中,通过接口服务被实现增、删、改、查的操作。 Ingress控制器(Ingress Controller):用以实时监控资源对象Ingress、Service、End-point、Secret(主要是TLS证书和Key)、Node、ConfigMap的变化,自动对Nginx进行相应的操作。
使用密钥 密钥创建后,可在工作负载环境变量和数据卷两个场景使用。 请勿对以下CCE系统使用的密钥做任何操作,详情请参见集群系统密钥说明。 请不要操作kube-system下的secrets。 请不要操作任何命名空间下的default-secret、paas.elb。其中,defa
作负载程序等。SFS文件系统不适合海量小文件业务,推荐使用SFS Turbo文件系统。 SFS为用户提供一个完全托管的共享文件存储,能够弹性伸缩至PB规模,具备高可用性和持久性,为海量数据、高带宽型应用提供有力支持。 符合标准文件协议:用户可以将文件系统挂载给服务器,像使用本地文件目录一样。
集群状态检查 检查项内容 集群升级后,需要检查集群状态是否为“运行中”状态。 检查步骤 系统会自动为您检查集群状态是否正常,您可以根据诊断结果前往集群列表页面进行确认。 解决方案 当集群状态异常时,请联系技术支持人员。 父主题: 升级后验证