搜索_华为云

升级操作系统 - 云容器引擎 CCE

升级操作完成后，节点将会自动开机。为确保节点稳定性，系统会预留部分CPU和内存资源，用于运行必须的系统组件。约束与限制使用私有镜像的节点暂不支持升级操作。老版本的节点升级操作系统时可能存在兼容性问题，请手动重置节点完成操作系统升级。默认节点池登录CCE控制台。单击集群名

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点池 > 管理节点池
监控NGINX Ingress控制器指标 - 云容器引擎 CCE

eus监控了哪些目标。图2 查看监控目标监控NGINX Ingress控制器指标访问Prometheus，在“Graph”页面中，查看NGINX Ingress控制器指标。图3 查看NGINX Ingress控制器监控指标表1 NGINX Ingress控制器监控指标指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
通过AOM配置自定义告警 - 云容器引擎 CCE

各种资源是否存在异常。告警配置流程在SMN创建主题。创建行动规则。添加告警规则。事件类告警：根据集群上报到AOM的事件配置告警。推荐配置的事件和配置方法请参见添加事件类告警。指标类告警：实时监控环境中主机、组件等资源使用情况，根据监控指标阈值告警。推荐配置阈值指标和配置方法请参见添加指标类告警。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
云原生监控插件版本发布记录 - 云容器引擎 CCE

云原生监控插件版本发布记录表1 云原生监控插件版本记录插件版本支持的集群版本更新特性社区版本 3.12.0 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 适配CCE v1.31集群升级Prometheus版本 2.53

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
GPU视图 - 云容器引擎 CCE
GPU视图 - 云容器引擎 CCE

GPU视图 GPU资源指标可以衡量GPU性能和使用情况，包括GPU的利用率、温度、显存等方面的监控数据，帮助您掌控GPU运行状况。指标说明图1 GPU资源指标表1 GPU图表说明图表名称单位说明集群-显存使用率百分比集群的显存使用率计算公式：集群内容器显存使用总量/集群内显存总量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
使用Prometheus监控控制节点组件指标 - 云容器引擎 CCE

erver组件进行监控，您在集群中开通云原生监控中心后（安装云原生监控插件版本为3.5.0及以上），可以查看仪表盘中的APIServer视图，监控API指标。如需对kube-controller、kube-scheduler、etcd-server组件进行监控，请参考以下步骤。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
CoreDNS视图 - 云容器引擎 CCE
CoreDNS视图 - 云容器引擎 CCE

CoreDNS视图提供了负载域名解析的CoreDNS监控视图，包含请求、响应情况，以及缓存状况。指标说明 CoreDNS视图暴露的指标如下：图1 CoreDNS视图指标表1 CoreDNS指标说明指标名称单位说明请求速率个/秒 CoreDNS每秒请求个数请求速率(记录类型)

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 Prometheus具有PrometheusRule的能力，PrometheusRules提供了一种用于监控和警报的规则语言，能够方便用户更好的使用Prometheus查询监控指标，配置基于PromQL的告警规则。当前云原生监控插件仅支持开启本地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

在“插件中心”页面右侧找到云原生监控插件，单击“安装”。在监控CCE Turbo集群容器网络扩展指标的场景下，建议您关注以下配置。该插件的其他配置可按需进行设置，详情请参见云原生监控插件。本地数据存储：此处选择使用本地存储监控数据，监控数据可选择是否对接AOM或三方监控平台。自定义指标采

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
CCE AI套件（NVIDIA GPU）插件使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

orter数据采集。已开启“系统预置采集”：如果您已安装云原生监控插件，并且已在“配置中心”中开启“系统预置采集”，则需要在“系统预置采集”中开启dcgm-exporter数据采集。未开启系统预置采集已开启系统预置采集如果您暂未安装云原生监控插件，或安装云原生插件后暂未在

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
改造流程 - 云容器引擎 CCE
改造流程 - 云容器引擎 CCE

改造流程整体应用容器化改造时，需要执行完整的改造流程。容器化改造流程包括：分析应用、准备应用运行环境、编写开机脚本、编写Dockerfile、制作并上传镜像、创建容器工作负载。改造流程每一部分的详情可参考改造流程。图1 容器化改造流程父主题：实施步骤

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器化改造 > 企业管理应用容器化改造（ERP） > 实施步骤
Node视图 - 云容器引擎 CCE
Node视图 - 云容器引擎 CCE

Node视图从节点视角出发，加入了节点资源、网络、磁盘等关键指标呈现，帮助您掌控节点运行状况。指标说明 Node视图暴露的指标如下：图1 Node资源指标表1 Node资源指标说明指标名称单位说明节点CPU使用率百分比节点CPU使用率 CPURequests水位

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
开启集群过载控制 - 云容器引擎 CCE

开启集群过载控制集群过载是指系统的负载（如请求量、资源使用量等）超过了其自身的处理能力，导致系统性能下降甚至崩溃。而过载控制是一种动态调整机制，可以根据控制节点的资源压力，限制系统外部请求的并发量，从而维护控制节点和集群的稳定性和可靠性。在CCE Standard/Turbo集

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

底层存储细节，因此没有感知底层存储故障的能力。云监控服务CES 具备查看云服务监控指标的能力：云监控服务基于云服务自身的服务属性，已经内置了详细全面的监控指标。当用户在云平台上开通云服务后，系统会根据服务类型自动关联该服务的监控指标，帮助用户实时掌握云服务的各项性能指标，精确掌握云服务的运行情况。

帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置集群中包含GPU节点时，可通过GPU指标查看节点GPU资源的使用情况，例如GPU利用率、显存使用量等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，在业务波动时自适应调整应用的副本数量。前提条件目标集群已创建，且

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？问题描述： CCE集群界面的某个节点磁盘监控高达80%以上，而进入云监控界面看到的磁盘使用率在40%不到。后面在该节点上排查，发现有一个pvc磁盘使用达到了92%，将这个盘清理后，集群界面的磁盘使用率和云监控使用率一致了。请问集群界面的节点监控是怎么

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
操作系统问题说明 - 云容器引擎 CCE

操作系统问题说明低版本内核的CentOS节点反复创删应用时偶现cgroup kmem泄露问题 CCE集群IPVS转发模式下conn_reuse_mode问题说明 cgroup统计资源异常导致kubelet驱逐Pod 低版本内核的CentOS节点出现容器OOM时，偶现ext4文件系统卡死问题

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点
操作系统版本支持机制 - 云容器引擎 CCE

操作系统版本支持机制同步机制云容器引擎CCE发布的集群节点组件会随CCE集群版本发布定期更新。操作系统重大漏洞修复：跟随集群补丁升级策略发布。集群版本与操作系统对应关系如下为当前已经发布的集群版本与操作系统版本的对应关系，请参考：表1 弹性云服务器-虚拟机节点操作系统

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 操作系统镜像发布记录
节点系统参数优化 - 云容器引擎 CCE

节点系统参数优化可优化的节点系统参数列表修改节点日志缓存内存占用量上限RuntimeMaxUse 修改最大文件句柄数修改节点内核参数修改节点进程 ID数量上限kernel.pid_max 父主题：节点运维

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
工作负载的“事件”保存多长时间？ - 云容器引擎 CCE

2-r3及以上版本的集群中，工作负载的“事件”信息保存时间为1个小时，1小时后自动清除数据。在1.7.3-r12之前更老的集群版本中，保存时间为24小时。父主题：监控日志

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志

总条数： 800

上一页
1
2
3
4
5
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

升级操作系统 - 云容器引擎 CCE

监控NGINX Ingress控制器指标 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

云原生监控插件版本发布记录 - 云容器引擎 CCE

GPU视图 - 云容器引擎 CCE

使用Prometheus监控控制节点组件指标 - 云容器引擎 CCE

CoreDNS视图 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

改造流程 - 云容器引擎 CCE

Node视图 - 云容器引擎 CCE

开启集群过载控制 - 云容器引擎 CCE

CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

操作系统问题说明 - 云容器引擎 CCE

操作系统版本支持机制 - 云容器引擎 CCE

节点系统参数优化 - 云容器引擎 CCE

工作负载的“事件”保存多长时间？ - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线