检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
rest_client_requests_total Counter 请求apiserver的总次数(按照返回码code和请求类型method统计) rest_client_request_duration_seconds_bucket Histogram 请求apiserver的总次数(按照返回码code和请求类型method统计)的分布情况
Prometheus Agent视图 Prometheus Agent是轻量化的容器监控模式,可以收集有关主机和应用程序的指标数据,并将数据上报并存储到AOM或三方监控平台。Prometheus Agent视图展示了Prometheus提供的一些内置指标,可用于监控和度量系统的性能和状态。
标签选择器,Service通过标签选择Pod,将访问Service的流量转发给Pod app: jenkins-master type: ClusterIP # Service的类型,ClusterIP表示在集群内访问类型的Service 输入完成后,Esc键退出编辑,输入:wq保存。
使用仪表盘 仪表盘集合了不同视角、不同组件的高频监控指标。将不同的指标以图表的形式直观、综合性地汇集在同一个屏幕上,帮助您实时全面地掌握集群整体运行状况。 仪表盘提供了丰富的视图监控指标呈现,包括集群视图、Pod视图等等。 前提条件 集群处于“运行中”状态。 集群已开通“监控中心”。
K8s废弃API检查异常处理 检查项内容 系统会扫描过去一天的审计日志,检查用户是否调用目标K8s版本已废弃的API。 由于审计日志的时间范围有限,该检查项仅作为辅助手段,集群中可能已使用即将废弃的API,但未在过去一天的审计日志中体现,请您充分排查。 解决方案 检查说明 根据检
FS Turbo资源进行实际的扩容,需要用户自行保证SFS Turbo的总容量不被耗尽。 创建Deployment挂载已有数据卷 新建一个Deployment的YAML文件,例如deployment-test.yaml。 配置示例: apiVersion: apps/v1 kind:
管理工作负载伸缩策略 操作场景 HPA策略创建完成后,可对创建的策略进行更新、克隆、编辑YAML以及删除等操作。 查看HPA策略 您可以查看HPA策略的规则、状态和事件,参照界面中的报错提示有针对性的解决异常事件。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中单击“策
K8s废弃资源检查异常处理 检查项内容 检查集群是否存在对应版本已经废弃的资源。 解决方案 问题场景一: 1.25及以上集群中的service存在废弃的annotation:tolerate-unready-endpoints 报错日志信息如下: some check failed
是否存在兼容性限制。 解决方案 检测到目标cce-controller-hpa插件版本存在兼容性限制,需要集群安装能提供metrics api的插件,例如metrics-server; 请您在集群中安装相应metrics插件之后重试检查 父主题: 升级前检查异常问题排查
Master节点SSH连通性检查异常处理 检查项内容 该检查通过尝试建立SSH连接,检查CCE是否能通过SSH方式连接至您的Master节点。 解决方案 SSH连通性检查可能有较低概率因为网络波动检查失败,请您优先重试升级前检查; 若重试检查仍无法通过检查,请您提交工单,联系技术支持人员排查。
健康检查使用UDP协议的安全组规则说明 操作场景 Autopilot集群使用独享型ELB,当负载均衡协议为UDP时,健康检查也采用UDP协议,您需要打开ENI安全组的ICMP协议安全组规则,入方向规则放通ELB后端子网网段的源地址。 操作步骤 登录CCE控制台,单击服务列表中的“网络
HTTPS类型负载均衡证书一致性检查异常处理 检查项内容 检查HTTPS类型负载均衡所使用的证书,是否在ELB服务侧被修改。 解决方案 该问题的出现,一般是由于用户在CCE中创建HTTPS类型Ingress后,直接在ELB证书管理功能中修改了Ingress引用的证书,导致CCE集群中存储的证书内容与E
myhuaweicloud.com。 docker-username:填写SWR登录指令中的用户名。 获取方式:登录SWR控制台,“总览”界面右上角单击“登录指令”,查看临时登录指令页签中命令,命令中-u后的内容即为用户名。 docker-password:填写SWR登录指令中的密码。 获取方式
网络管理 如何正确配置集群安全组规则?
存储管理 CCE Autopilot集群中的EVS存储卷被删除或者过期后是否可以恢复? 创建存储卷失败如何解决? CCE Autopilot集群云存储PVC能否感知底层存储故障? 删除动态创建的PVC之后,底层存储有残留如何解决?
工作负载 工作负载异常问题排查 监控日志
监控日志 容器监控的内存使用率与实际弹性伸缩现象不一致 父主题: 工作负载
工作负载异常问题排查 创建工作负载时无法拉取SWR镜像如何解决? 创建工作负载时无法拉取公网镜像如何解决? 工作负载事件中出现Cluster pod max limit exceeded如何解决? 创建工作负载时,Pod不断被重建如何解决? 父主题: 工作负载
在CCE Autopilot集群中部署并使用Jenkins CCE Autopilot集群部署并使用Jenkins方案概述 资源和成本规划 实施步骤
户多元异构的资源需求,并持续迭代优化性能。无论是面对突发流量、季节性波动还是长期增长,用户无需提前规划和预留资源,实现容器秒级弹性,根据负载规模自动进行扩缩,确保业务的连续性和性能的最优化。用户可以在短时间内快速上线新应用或服务,快速响应市场变化。 全面兼容的云原生开源生态 CCE