搜索_华为云

删除节点池 - 云容器引擎 CCE
删除节点池 - 云容器引擎 CCE

本地持久存储卷的Pod会从删除的节点上驱逐，并重新创建Pod，Pod会一直处于pending状态，因为Pod使用的PVC带有节点标签，由于冲突无法调度成功。注意事项删除节点池会同时删除节点池下的全部节点，请及时备份数据，避免重要数据丢失。删除节点会涉及Pod迁移，可能会影响

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点池 > 管理节点池
集群视图 - 云容器引擎 CCE
集群视图 - 云容器引擎 CCE

内存Limit水位百分比集群整体内存Limits占集群内存容量的百分比。 Pod数个集群中处在不同运行状态下的Pod个数（状态包含：Failed、Pending、Running、Succeeded、Unknown等）。容器数个集群中处在不同运行状态下的容器个数（状态包含：Containers

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
主机视图 - 云容器引擎 CCE
主机视图 - 云容器引擎 CCE

主机视图从主机视角出发，监控主机的资源占用与健康状态，查看主机的磁盘、文件系统等常用系统设备指标，帮助您掌控节点运行状况。指标说明主机视图暴露的指标具体说明如下：图1 主机资源指标表1 视图说明图表名称单位说明 CPU使用率百分比每个CPU核的使用率平均负载

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

XGPU视图 XGPU是虚拟化的GPU设备，从XGPU视图可以在节点、GPU卡、容器等多个角度监控XGPU虚拟化设备的显存、算力分配率，帮助您掌控GPU运行状况。指标说明图1 XGPU资源指标表1 XGPU视图图表说明图表名称单位说明集群-XGPU设备显存使用率百分比

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
安全组检查异常处理 - 云容器引擎 CCE

安全组”，在搜索框内输入集群名称，此时预期过滤出两个安全组：安全组名称为“集群名称-node-xxx”，此安全组关联CCE用户节点。安全组名称为“集群名称-control-xxx”，此安全组关联CCE控制节点。图1 查看集群安全组单击用户节点安全组，确保含有如下规则允许Master节点使用ICMP协议访问节点。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 - 云容器引擎 CCE

IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时故障现象在集群使用IPVS转发的场景下，节点上升级CoreDNS后，可能出现概率性丢包，导致域名解析失败。问题根因该问题由IPVS缺陷导致，社区已在IPVS v5.9-rc1版本中修复该问题，详情请参见ipvs:

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
节点Kubelet检查异常处理 - 云容器引擎 CCE

集群可用，但节点状态为“不可用”修复节点后，重试检查任务。问题场景二：cce-pause版本异常检测到当前kubelet依赖的pause容器镜像版本非cce-pause:3.1，继续升级将会导致批量Pod重启，当前暂不支持升级，请联系技术支持人员。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点Ready检查异常处理 - 云容器引擎 CCE

节点Ready检查异常处理检查项内容检查集群内节点是否Ready。解决方案问题场景一：节点状态显示不可用请登录CCE控制台，单击集群名称进入集群控制台，前往“节点管理”，筛选出状态不可用的节点后，请参照控制台提供的“修复建议”修复该节点后重试检查。问题场景二：节点状态与实际不符

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点journald检查异常处理 - 云容器引擎 CCE

节点journald检查异常处理检查项内容检查节点上的journald状态是否正常。解决方案请登录该节点，执行systemctl is-active systemd-journald命令查询journald服务运行状态。若回显状态异常，请执行systemctl restart

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
CoreDNS视图 - 云容器引擎 CCE
CoreDNS视图 - 云容器引擎 CCE

CoreDNS视图提供了负载域名解析的CoreDNS监控视图，包含请求、响应情况，以及缓存状况。指标说明 CoreDNS视图暴露的指标如下：图1 CoreDNS视图指标表1 CoreDNS指标说明指标名称单位说明请求速率个/秒 CoreDNS每秒请求个数请求速率(记录类型)

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
节点池检查异常处理 - 云容器引擎 CCE

问题场景：节点池操作系统不支持由于不同版本之间的运行时和OS存在差异，该异常通常发生在低版本集群升级到1.27及以上集群。当前CCE集群版本和OS的配套关系请参见节点操作系统说明。请登录CCE控制台，单击集群名称进入集群控制台，前往“节点管理“页面查看问题节点池，并单击节点池的“更新”。根据升级前

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点系统参数检查异常处理 - 云容器引擎 CCE

节点系统参数检查异常处理检查项内容检查您节点上默认系统参数是否被修改。解决方案如您的bms节点上bond0网络的mtu值非默认值1500，将出现该检查异常。非默认参数可能导致业务丢包，请改回默认值。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
残留packageversion检查异常处理 - 云容器引擎 CCE

检查当前集群中是否存在残留的packageversion。解决方案检查提示您的集群中存在残留的CRD资源10.12.1.109，该问题一般由于CCE早期版本节点删除后，对应的CRD资源未被清除导致。您可以尝试手动执行以下步骤：备份残留的CRD资源。10.12.1.109 为示例资源，请根据报错中提示的资源进行替换。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Prometheus Agent视图 - 云容器引擎 CCE

Agent视图说明视图指标单位描述 CPU使用率百分比 Prometheus Agent Pod CPU平均使用率内存使用率百分比 Prometheus Agent Pod 内存平均使用率远程写Bps 字节/秒每秒远程写入的字节数远程写平均耗时秒远程写入平均耗时

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
APIServer视图 - 云容器引擎 CCE
APIServer视图 - 云容器引擎 CCE

APIServer视图提供了Kubernetes核心组件APIServer主要监控视图，帮助您更好的监控APIServer的运行状态。主要包括APIServer组件的请求、资源、工作队列等相关指标。指标说明 APIServer视图暴露的指标包括请求指标、工作队列指标和资源指标，具体说明如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
节点池视图 - 云容器引擎 CCE
节点池视图 - 云容器引擎 CCE

表2 指标说明指标名称单位说明 kube_node_labels Gauge 节点标签，其中label_cce_cloud_com_cce_nodepool为CCE节点池名称，若无该标签值则为Default Pool。 node_cpu_seconds_total Counter

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
低版本内核的CentOS节点反复创删应用时偶现cgroup kmem泄露问题 - 云容器引擎 CCE

el7.x86_64的场景下（主要为1.17.9版本集群），反复创建应用时出现cgroup kmem泄露，导致节点内存有空余，但是无法创建新的Pod，并提示报错Cannot allocate memory。问题根因在反复创建应用时会创建的临时memory cgroup，但在应用删除时，内核已经删除了

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
使用仪表盘 - 云容器引擎 CCE
使用仪表盘 - 云容器引擎 CCE

仪表盘提供了丰富的视图监控指标呈现，包括集群视图、APIServer视图、Pod视图、主机视图、Node视图等等。前提条件集群版本高于v1.17。集群处于“运行中”状态。集群已开通“监控中心”。查看/切换视图登录CCE控制台，单击集群名称进入集群详情页。在左侧导航栏中选择“监控

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
节点关键目录文件权限检查异常处理 - 云容器引擎 CCE

节点关键目录文件权限检查异常处理检查项内容检查CCE使用的目录/var/paas内文件的属主和属组是否都为paas。解决方案问题场景一：错误信息为“xx file permission has been changed!”。解决方案： CCE使用/var/paas目录进行基本的节

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点paas用户登录权限检查异常处理 - 云容器引擎 CCE

节点paas用户登录权限检查异常处理检查项内容检查paas用户是否有登录权限。解决方案执行以下命令查看paas用户是否有登录权限： sudo grep "paas" /etc/passwd 如果paas用户权限中带有"nologin"或者"false"，说明paas用户没

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查

总条数： 1443

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

删除节点池 - 云容器引擎 CCE

集群视图 - 云容器引擎 CCE

主机视图 - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

安全组检查异常处理 - 云容器引擎 CCE

IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 - 云容器引擎 CCE

节点Kubelet检查异常处理 - 云容器引擎 CCE

节点Ready检查异常处理 - 云容器引擎 CCE

节点journald检查异常处理 - 云容器引擎 CCE

CoreDNS视图 - 云容器引擎 CCE

节点池检查异常处理 - 云容器引擎 CCE

节点系统参数检查异常处理 - 云容器引擎 CCE

残留packageversion检查异常处理 - 云容器引擎 CCE

Prometheus Agent视图 - 云容器引擎 CCE

APIServer视图 - 云容器引擎 CCE

节点池视图 - 云容器引擎 CCE

低版本内核的CentOS节点反复创删应用时偶现cgroup kmem泄露问题 - 云容器引擎 CCE

使用仪表盘 - 云容器引擎 CCE

节点关键目录文件权限检查异常处理 - 云容器引擎 CCE

节点paas用户登录权限检查异常处理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线