检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品优势 智能可靠的集群免运维体验 CCE Autopilot集群通过智能化版本升级、漏洞自动修复和智能调参等技术,给用户提供更稳定、更安全、更智能的集群使用体验。作为全托管的Serverless解决方案,它简化了容量规划和节点购买流程,用户无需管理和维护底层资源设施,大幅减少了
删除动态创建的PVC之后,底层存储有残留如何解决? 问题现象 删除集群中动态创建的PVC,PVC使用的StorageClass中reclaimPolicy为Delete模式,但删除PVC时底层存储却没有被同步删除。 触发场景 同时删除PVC和与其绑定的PV,会出现底层存储没有被同步删除的情况。
载(Deployment/StatefulSet)和普通任务(Job)使用,主要面向大数据分析、静态网站托管、在线视频点播、基因测序、智能视频监控、备份归档、企业云盘(网盘)等场景。 对象存储规格 对象存储提供了多种存储类别,从而满足客户业务对存储性能、成本的不同诉求。 对象桶:
管理工作负载和任务 操作场景 工作负载创建后,您可以对其执行升级、编辑YAML、日志、监控、回退、删除等操作。 表1 工作负载/任务管理 操作 描述 日志 可查看工作负载的日志信息。 升级 可以通过更换镜像或镜像版本实现无状态工作负载、有状态工作负载的快速升级,业务无中断。 编辑YAML
创建工作负载时,Pod不断被重建如何解决? 创建工作负载时,工作负载状态为“处理中”或“未就绪”,内部Pod实例不断被重建。并且查看Pod事件可以发现,创建Pod实例过程中“镜像拉取中(Pulling image xx)”事件停留的时间过长。该现象表明Pod免费提供的30GiB临
创建工作负载时无法拉取公网镜像如何解决? 问题现象 在Autopilot集群中创建工作负载时,事件中出现以下错误: Failed to pull image "100.125.**.**:32334/**/nginx:1.0": rpcerror: code =DeadlineExceeded
创建工作负载时无法拉取SWR镜像如何解决? 问题现象 在Autopilot集群中创建工作负载时,出现以下错误: Failed to pull image "swr.cn-north-**.myhuaweicloud.com/**/nginx:latest": rpc error:
检查步骤 业务不同,验证的方式也有所不同,建议您在升级前确认适合您业务的验证方式,并在升级前后均执行一遍。 常见的业务确认方式有: 业务界面可用 监控平台无异常告警与事件 关键应用进程无错误日志 API拨测正常等 解决方案 若集群升级后您的在线业务有异常,请联系技术支持人员。 父主题: 升级后验证
工作负载事件中出现Cluster pod max limit exceeded如何解决? 问题现象 创建工作负载时,事件中出现以下错误: Cluster pod max limit exceeded(x) 问题定位 该事件信息表示集群中的Pod数量达到上限值,无法再新建Pod,其
存使用率等等。而这些数据的监控能力Kubernetes也没有自己实现,而是通过其他项目来扩展Kubernetes的能力,Kubernetes提供Prometheus和Metrics Server插件来实现该能力: Prometheus是一套开源的系统监控报警框架,能够采集丰富的M
内完成升级,补丁升级始终默认开启。 升级窗口配置 设置集群维护窗口,指定自动升级开始时间、持续时长以及重复频率。例如,您可以配置每周重复的维护窗口(周一到周五,每天四小时)。 说明: 为保证充足的升级时长,集群维护窗口周期需设置为三个小时及以上。 告警中心 告警中心提供完善的集群
27.3-r30 v1.27.4 - 支持一键配置监控告警。 修复部分安全问题。 v1.27.3-r20 v1.27.4 支持安装NGINX Ingress控制器插件。 支持安装云原生监控插件以及云原生日志插件,实现对应用指标的监控以及应用日志采集。 支持应用模板市场。 支持自定义资源(CRD)的使用。
研的插件,能够基于CPU利用率、内存利用率等指标,对无状态工作负载进行弹性扩缩容。 主要功能 支持按照当前实例数的百分比进行扩缩容。 支持设置一次扩缩容的最小步长。 支持按照实际指标值执行不同的扩缩容动作。 约束与限制 cce-hpa-controller需要安装能够提供Metrics
可观测性 监控中心 日志中心 告警中心
工作负载 工作负载异常问题排查 监控日志
插件 CoreDNS域名解析 CCE容器存储插件(Everest) Kubernetes Metrics Server 云原生监控插件 云原生日志采集插件 NGINX Ingress控制器 CCE容器弹性引擎
rometheus-operator和Prometheus,提供简单易用的端到端Kubernetes集群监控能力。*注意:kube-prometheus-stack为系统监控插件,当集群资源不足时,Kubernetes会优先保证插件pod的调度。" },
使用HPA需要安装能够提供Metrics API的插件: Kubernetes Metrics Server:提供基础资源使用指标,例如容器CPU和内存使用率。 云原生监控插件:根据自定义指标进行弹性伸缩需要将自定义指标聚合到Kubernetes API Server,详情请参见使用自定义指标创建HPA策略。
群权限设置可以让某些用户组操作集群(如创建/删除集群、模板、插件等),而让某些用户组仅能查看集群。 集群权限涉及非Kubernetes原生提供的API,支持IAM细粒度策略、企业项目管理相关能力。 命名空间权限:是基于Kubernetes RBAC能力的授权,通过权限设置可以让不
的开源HTTP服务器和反向代理服务器,广泛用于处理高并发、负载均衡和静态资源服务。本示例以Nginx为例,帮助您了解如何创建CCE Autopilot集群以及如何在集群中部署工作负载。 操作流程 操作步骤 步骤说明 费用说明 准备工作 您需要注册华为账号,并为账户充值。 不涉及费用。