检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
IAM用户登录UCS无法获取集群或舰队怎么办? 问题描述 IAM用户登录UCS控制台,前往“容器舰队”页面后,无法获取已创建的舰队和已注册的集群(“容器舰队”和“未加入舰队的集群”页面均为空)。 解决方案 大多数IAM用户无法获取集群的问题,都和权限未设置或者设置不正确有关,IA
执行kubectl命令报错Error from server (Forbidden)怎么办? 问题描述 在使用集群联邦的过程中,执行kubectl命令,出现如下所示的报错信息。 可能原因 可能是由于集群联邦内成员集群的资源对象ClusterRole或者ClusterRoleBin
将已接入联邦且状态异常的集群移出舰队失败怎么办? 问题背景 舰队已开通集群联邦,对在舰队中运行状态异常的集群进行移出舰队操作,移出失败。 解决方案 再次单击目标集群右上角的,重新尝试将其移出舰队。 若重试后仍移出失败,请提交工单,联系技术支持人员进行处理。 父主题: 容器舰队
Master节点关机后集群控制台不可用怎么办? 问题描述 Master节点关机后,出现集群控制台不可用的情况。 操作步骤 此类问题是由于Cilium社区对“Terminating”状态的Pod并不会进行Cilium Endpoint摘除,导致部分请求分流到关机节点,从而导致请求失败。请按照如下指导处理:
华为云集群状态不可用,报cce cluster not found怎么办? 问题描述 华为云集群状态显示不可用,错误信息为cce cluster not found,please unregister cluster。 可能原因 您在CCE集群控制台手动删除了已注册在UCS中的集群,导致UCS中集群状态显示为不可用。
kube-prometheus-stack插件的kube-state-metrics组件负责将Prometheus的metrics数据格式转换成K8s API接口能识别的格式。kube-state-metrics组件在默认配置下,不采集K8s资源的所有labels和annotation。如需采集则需要在启
huawei-npu插件是支持容器里使用huawei NPU设备的管理插件。 安装本插件后,可支持使用NPU的节点,实现快速高效地处理推理和图像识别等工作。 前置条件 安装huawei-npu的节点需要添加标签“accelerator/huawei-npu”,标签值可为空。 使用npu插件在Ascend
配置条件触发自动切流 本小节指导您配置条件触发自动切流,以识别集群CoreDNS功能故障并自动摘除流量。 为集群安装CPD组件识别集群 在配置自动切流前,您需要在集群中安装CPD(cluster-problem-detector)组件,以自动探测集群CoreDNS域名解析功能是否正常,并进行上报。
到该集群上的请求将会失败。 UCS提供自动切流能力,可自动摘除故障集群上的流量,以进一步保障服务的可用性。自动切流能力的应用场景主要有: 识别集群故障并自动切流:在集群内关键组件CoreDNS功能故障后,自动探查并及时上报至控制面,将该集群上的流量摘除,由此保障服务可用性不受单个
容器舰队 舰队开通联邦校验失败怎么办? 将已接入联邦且状态异常的集群移出舰队失败怎么办? 部署Nginx Ingress后状态为未就绪怎么办? 执行kubectl命令报错Error from server (Forbidden)怎么办?
FullAccess、UCS CommonOperations、UCS CIAOperations和UCS ReadOnlyAccess)进行识别。 对于多云集群,目前只有华为云账号可以执行集群注册的操作,暂不支持IAM系统策略。 父主题: 权限管理
Server的工作负载的正常运行。为了帮助您快速识别和修复问题,资源概况中提供了API Server的总QPS和请求错误率指标。 资源消耗Top统计 在资源消耗TOP统计中,UCS服务会将CPU使用率和内存使用率排名前五的节点、无状态负载、有状态负载和Pod纳入统计范围,以帮助您识别资源消耗“大户”。 说明:
集群联邦 集群联邦升级前检查不通过怎么办? 集群加入联邦失败怎么办? 集群加入联邦时,状态校验失败如何排查? 联邦管理面创建HPA后分发到成员集群失败怎么办? 创建MCI对象失败怎么办? 通过MCI访问服务失败,如何排查? 创建MCS对象失败怎么办? MCS实例删除异常如何排查?
本地集群 本地集群接入失败怎么办? 如何手动清理本地集群节点? 如何进行Cgroup降级? 虚拟机SSH连接超时怎么办? 本地集群如何扩容容器智能分析插件的存储磁盘? Master节点关机后集群控制台不可用怎么办? 节点扩容规格后未就绪怎么办? 如何更新本地集群ca/tls证书?
统计在UCS控制台集群列表上的CPU和内存分配率指标中,那么需要为这个节点打上“type:virtual-kubelet”标签,以便您准确识别集群资源分配情况。为集群节点打标签请参照为节点添加标签/污点。 父主题: UCS集群
策略中心 启用策略中心失败怎么办? 策略中心运行异常怎么办? 如何清理策略中心相关资源?
附着集群 附着集群接入失败怎么办? 私网接入的集群误删除VPCEP后如何恢复? proxy-agent部署失败怎么办?
行跨命名空间、跨集群、跨舰队的配置分发与配置管理的能力。对用户部署在各集群的业务提供实时的状态观测和消息通知,以确保应用出现问题时可以快速识别和定位,保障使用客户业务App的终端用户的使用体验和服务级别目标(SLO)达成。 Kustomize是一个Kubernetes应用程序配置
权限相关 如何配置UCS控制台各功能的访问权限? IAM用户登录UCS无法获取集群或舰队怎么办? 误删除或修改ucs_admin_trust委托后如何恢复? 舰队或集群关联权限异常怎么办? 集群注销后如何清理权限相关资源? 如何精细化管理集群联邦权限?
容器智能分析 集群因插件资源残留开启监控失败怎么办? 集群因策略拦截开启监控失败怎么办? 如何修改kube-state-metrics组件的采集配置?