搜索_华为云

当集群状态为“不可用”时，如何排查解决？ - 云容器引擎 CCE

排查项二：集群是否过载排查项三：集群Secret落盘加密使用的KMS密钥是否有效如果以上排查思路仍无法解决您的问题，请提交工单寻找客服人员协助您进行定位。排查项一：安全组是否被修改登录控制台，选择“服务列表 > 网络 > 虚拟私有云 VPC”，单击左侧导航栏的“访问控制 > 安全组”，找到集群控制节点的安全组。

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
高频常见问题 - 云容器引擎 CCE

如何让多个Pod均匀部署到各个节点上？如何驱逐节点上的所有Pod？网络管理集群安全组规则配置工作负载网络异常时，如何定位排查？为什么访问部署的应用时浏览器返回404错误码？节点无法连接互联网（公网），如何排查定位？解析外部域名很慢或超时，如何优化配置？存储管理无法使用kubectl命令删除PV或PVC

帮助中心 > 云容器引擎 CCE > 常见问题
控制台访问异常问题排查 - 云容器引擎 CCE

登录CCE控制台，单击集群名称进入集群。选择左侧导航栏的“工作负载”，查看工作负载容器组运行状态是否为“运行中”，若不是，请根据工作负载状态异常定位方法进行排查。在集群“总览”页面，在“网络信息”选择“节点默认安全组”，单击跳转到安全组页面，查看安全组入方向规则。检查所有安全组规则

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
监控中心概述 - 云容器引擎 CCE

可实时监控应用及资源，采集各项指标及事件等数据以分析应用健康状态，提供全面、清晰、多维度数据可视化能力，兼容主流开源组件，并提供快捷故障定位的能力。功能介绍多维度数据洞察：提供基于Kubernetes原生类型的容器监控能力，支持集群、节点、工作负载、Pod和事件的指标展示，全面监控集群的健康状态和负荷程度。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
容器异常退出状态码 - 云容器引擎 CCE

当容器启动失败或终止时，K8s事件中将会打印容器异常退出状态码（Exit Code）来报告容器异常的原因。本文将介绍如何通过事件中打印的Exit Code进一步定位容器异常的根本原因。查看容器异常退出状态码您可使用kubectl连接集群，并通过以下命令查询Pod详细状态： kubectl describe

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

组成。而PromQL是Prometheus的核心组件之一，使用标识符和标签组成的简单表达式对时间序列进行筛选和聚合，使用户能够根据需要快速定位和解决问题。有关PromQL的更多使用方法，请参见查询Prometheus。通过控制台获取华为云Prometheus监控数据在集群中

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
业务检查 - 云容器引擎 CCE
业务检查 - 云容器引擎 CCE

遍。常见的业务确认方式有：业务界面可用监控平台无异常告警与事件关键应用进程无错误日志 API拨测正常等解决方案若集群升级后您的在线业务有异常，请联系技术支持人员。父主题：升级后验证

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
云原生监控插件版本发布记录 - 云容器引擎 CCE

新增采集自定义指标的开关，默认开启移除对1.17和1.19版本集群的支持 Grafana从云原生监控插件中移除，拆分为独立的Grafana插件默认只采集免费指标和服务发现自定义指标升级开源组件版本 2.37.8 3.8.2 v1.17 v1.19 v1.21 v1.23 v1.25 v1.27

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
Node节点vdb盘受损，通过重置节点仍无法恢复节点？ - 云容器引擎 CCE

问题过程：在一个正常的node节点上，删除lv，删除vg，节点不可用。重置异常节点，重置过程中，报语法错误，而且节点不可用。如下图：问题定位 node节点中vg被删除或者损坏无法识别，为了避免重置的时候误格式化用户的数据盘，需要先手动恢复vg，这样重置的时候就不会去格式化其余的数据盘。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
CCE最佳实践汇总 - 云容器引擎 CCE

r-framework拓展默认调度器 kube-scheduler如何完成调度和调整调度权重 CCE云原生混部场景下在线任务抢占、压制离线任务CPU资源、保障在线任务服务质量效果测试 Kubernetes容器存储相关 Kubernetes子路径subpath原理及使用场景 Kubernetes容器域名相关

 帮助中心 > 云容器引擎 CCE > 最佳实践
云原生混部概述 - 云容器引擎 CCE

级高的业务SLO。资源分级管控为业务潮汐明显的在线业务间混部、在线和离线业务混部奠定了基础。解决了应用预留资源较多、资源无法分时复用的问题。在线作业与离线作业从业务是否一直在线的角度看，其类型可分为在线作业和离线作业。在线作业：一般运行时间长，服务流量呈周期性，资源存在潮

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部
Prometheus插件平滑迁移实践 - 云容器引擎 CCE

集群内资源占用非常低，可以显著节省您的计算和存储成本，AOM服务按照上报的指标量进行计费，其中，基础指标免费，自定义指标按量计费；自定义指标可以按需废弃，您可以仅保留基础免费指标使用AOM。该模式暂不支持基于自定义普罗语句的HPA。基于本地存储的传统模式与Prometheus

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
关于CentOS停止维护的通知 - 云容器引擎 CCE

HCE打造云原生、高性能、高安全、易迁移等能力，加速用户业务上云，提升用户的应用创新空间，可替代CentOS、EulerOS等公共镜像。适用于希望使用免费镜像，并延续开源社区镜像使用习惯的个人或企业。 Ubuntu操作系统 Linux的其他发行版操作系统，不同操作系统在使用习惯和应用兼容性上存在一定差异。

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品变更公告
网络异常问题排查 - 云容器引擎 CCE

网络异常问题排查工作负载网络异常时，如何定位排查？负载均衡类型Service异常问题排查集群内部无法使用ELB地址访问负载集群外部访问Ingress异常 CCE集群中域名解析失败为什么访问部署的应用时浏览器返回404错误码？为什么容器无法连接互联网？ VPC的子网无法删除，怎么办？

帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理
域名DNS - 云容器引擎 CCE
域名DNS - 云容器引擎 CCE

域名DNS CCE集群内域名解析失败，如何定位处理？为什么CCE集群的容器无法通过DNS解析？为什么修改子网DNS配置后，无法解析租户区域名？解析外部域名很慢或超时，如何优化配置？如何设置容器内的DNS策略？

帮助中心 > 云容器引擎 CCE > 常见问题
通过告警中心一键配置告警 - 云容器引擎 CCE

com”。支持在联系组创建完成后修改告警消息显示名。添加订阅终端：您需要添加一个或多个订阅终端来接收告警消息。终端类型包括短信和邮件，选择“短信”时，请输入有效的手机号码；选择“邮件”时，请输入有效的电子邮件地址。单击“确定”完成联系组的绑定。返回联系组列表，订阅终端状态为“未确认”，您需要继续执行后

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
调度策略 - 云容器引擎 CCE
调度策略 - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？为什么Pod调度不到某个节点上？修改kubelet参数导致已驱逐的Pod被重新调度根据GPU/NPU卡信息定位使用该卡的Pod 父主题：工作负载

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载
容器应用部署上云CheckList - 云容器引擎 CCE

以上修改都会导致CCE集群功能异常。主动运维云容器引擎提供多维度的监控和告警功能，配置监控告警，以便于异常时及时收到告警并进行故障定位。云监控服务AOM：CCE默认的基础资源监控，覆盖详细的容器相关指标，并提供告警配置能力。开源Prometheus：面向云原生应用程序

 帮助中心 > 云容器引擎 CCE > 最佳实践
节点管理最佳实践 - 云容器引擎 CCE

创建节点时执行安装前/后脚本创建节点时使用OBS桶实现自定义脚本注入选择合适的节点数据盘大小节点日常管理实践存储扩容通过Core Dump文件定位容器问题容器与节点时区同步将节点容器引擎从Docker迁移到Containerd 节点安全实践 CCE节点安全配置建议父主题：节点

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
弹性伸缩概述 - 云容器引擎 CCE

、弹性优化、成本优化的功能。全场景支持，适合在线业务、深度学习、大规模成本算力交付等。节点自动伸缩 CCE突发弹性引擎（对接CCI）将Kubernetes API扩展到无服务器的容器平台（如CCI），无需关心节点资源。适合在线突增流量、CI/CD、大数据作业等场景。 CCE容器实例弹性伸缩到CCI服务

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩

总条数： 135

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

当集群状态为“不可用”时，如何排查解决？ - 云容器引擎 CCE

高频常见问题 - 云容器引擎 CCE

控制台访问异常问题排查 - 云容器引擎 CCE

监控中心概述 - 云容器引擎 CCE

容器异常退出状态码 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

业务检查 - 云容器引擎 CCE

云原生监控插件版本发布记录 - 云容器引擎 CCE

Node节点vdb盘受损，通过重置节点仍无法恢复节点？ - 云容器引擎 CCE

CCE最佳实践汇总 - 云容器引擎 CCE

云原生混部概述 - 云容器引擎 CCE

Prometheus插件平滑迁移实践 - 云容器引擎 CCE

关于CentOS停止维护的通知 - 云容器引擎 CCE

网络异常问题排查 - 云容器引擎 CCE

域名DNS - 云容器引擎 CCE

通过告警中心一键配置告警 - 云容器引擎 CCE

调度策略 - 云容器引擎 CCE

容器应用部署上云CheckList - 云容器引擎 CCE

节点管理最佳实践 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线