搜索_华为云

集群删除失败：安全组中存在残留资源 - 云容器引擎 CCE

集群删除失败：安全组中存在残留资源 CCE在删除集群时，会连接集群的kube-apiserver查询集群对接的周边资源信息，如Turbo集群对接的弹性网卡/弹性辅助网卡等，当CCE集群的状态为不可用，冻结，休眠等状态时，删除集群有可能会出现查询资源失败而导致集群删除失败的情况。故障现象删除集群失败，报错信息如下：

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群删除
工作负载异常：Pod一直处于Terminating状态 - 云容器引擎 CCE

工作负载异常：Pod一直处于Terminating状态问题描述查询某个命名空间下的工作负载时，偶现部分Pod（实例）一直处于Terminating 状态。例如，查询aos命名空间下的Pod： #kubectl get pod -n aos NAME

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
kubelet性能配置 - 云容器引擎 CCE

kubelet性能配置请求至kube-apiserver的QPS配置与kube-apiserver通信的qps 参数名取值范围默认值是否允许修改作用范围 kube-api-qps 大于等于0 100 允许 CCE Standard/CCE Turbo 与kube-apiserver通信的qps

帮助中心 > 云容器引擎 CCE > 配置参考 > 节点
调度器性能配置 - 云容器引擎 CCE

调度器性能配置请求至kube-apiserver的QPS配置与kube-apiserver通信的qps 参数名取值范围默认值是否允许修改作用范围 kube-api-qps 大于等于0 100 允许 CCE Standard/CCE Turbo 与kube-apiserver通信的qps

帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
控制器性能配置 - 云容器引擎 CCE

控制器访问kube-apiserver的QPS 配置建议：无特殊需求建议保持默认配置配置过大可能会导致kube-apiserver过载，配置过小可能会触发客户端限流，对控制器性能产生影响控制器访问kube-apiserver的突发流量上限控制器访问kube-apiserver的突发流量上限

 帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
集群过载保护最佳实践 - 云容器引擎 CCE

出现集群过载现象。客户端查询数据量过大：如发起大量LIST请求，或单个LIST请求查询大量数据。假设客户端通过Field Selectors指定查询集群中的部分pod数据，并且需要查询etcd（客户端也可以指定从kube-apiserver缓存查询）。由于etcd无法按Fie

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
负载感知调度 - 云容器引擎 CCE

若存在回显，则表示Metrics API已开启，可跳过本步骤进行下一步添加指标采集规则。若未查询到Metrics API，要将其开启，可手动创建对应APIService对象。创建一个文件，命名为metrics-apiservice.yaml。文件内容如下： apiVersion: apiregistration

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
Headless Service - 云容器引擎 CCE
Headless Service - 云容器引擎 CCE

s Service不会创建ClusterIP，并且查询会返回所有Pod的DNS记录，这样就可查询到所有Pod的IP地址。有状态负载StatefulSet正是使用Headless Service解决Pod间互相访问的问题。 apiVersion: v1 kind: Service

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 服务（Service）
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

etrics-apiserver工作负载。图3 重新部署custom-metrics-apiserver 重启后，可以通过以下指令查看对应的Pod的指标是否正常（注意替换命名空间和业务Pod名）。 # 查询指标 $ kubectl get --raw "/apis/custom

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

本文将介绍如何使用Prometheus对Master节点的kube-apiserver、kube-controller、kube-scheduler、etcd-server组件进行监控。通过监控中心查看Master节点组件指标云原生监控中心已支持对Master节点的kube-apiserver组件进行监控，您在集

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
诊断项及修复方案 - 云容器引擎 CCE

节点不可调度将导致节点资源不能被正常使用，请前往CCE节点管理，查看节点状态是否符合预期。节点kubelet状态是 kubelet为节点关键组件，不可用可能会导致节点异常，Pod状态不符合预期（与APIServer的Pod状态不一致）。可以到节点上通过如下命令查看kubelet日志，并分析异常原因。命令参考：journalctl

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
云原生监控插件 - 云容器引擎 CCE

缩。插件可为Kubernetes提供Metrics API，但默认未开启，若要将其开启，需要创建以下APIService对象： apiVersion: apiregistration.k8s.io/v1 kind: APIService metadata: labels:

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
Helm模板检查异常处理 - 云容器引擎 CCE

检查当前HelmRelease记录中是否含有目标集群版本不支持的K8s废弃API，可能导致升级后helm模板不可用。解决方案将HelmRelease记录中K8s废弃API转换为源版本和目标版本均兼容的API。该检查项解决方案已在升级流程中自动兼容处理，此检查不再限制。您无需关注并处理。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Docker Engine授权插件AuthZ权限绕过漏洞公告（CVE-2024-41110） - 云容器引擎 CCE

ocker守护进程的API请求。漏洞详情表1 漏洞信息漏洞类型 CVE-ID 漏洞级别披露/发现时间权限提升 CVE-2024-41110 严重 2024-07-25 漏洞影响受影响版本中，攻击者可以使用Content-Length设置为0的API请求绕过权限检查，导

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
日志审计 - 云容器引擎 CCE
日志审计 - 云容器引擎 CCE

日志审计云审计服务支持的CCE操作列表在CTS事件列表查看云审计事件父主题：云原生观测

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测
使用Kubectl命令进行命名空间RBAC授权 - 云容器引擎 CCE

可以执行GET、LIST操作 apiGroups表示资源所在的API分组。 resources表示可以操作哪些资源：pods表示可以操作pod，其他Kubernetes的资源如deployments、configmaps等都可以操作 verbs表示可以执行的操作：get表示查询一个Pod，li

帮助中心 > 云容器引擎 CCE > 最佳实践 > 权限
通过配置容器内核参数增大监听队列长度 - 云容器引擎 CCE

x.x #节点名称进入容器查看参数配置是否生效。 kubectl exec -it <pod name> -- /bin/sh 在容器中执行如下命令查询配置参数是否生效。 sysctl -a |grep somax 图3 查看参数配置父主题：网络

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络
监控 - 云容器引擎 CCE
监控 - 云容器引擎 CCE

使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据

 帮助中心 > 云容器引擎 CCE > 最佳实践
模板格式不正确，无法删除模板实例？ - 云容器引擎 CCE

您可以使用kubectl命令删除残留的模板实例。删除残留的模板实例无法从根本上解决该问题。为避免该问题再次发生，建议您及时更新模板中资源的apiVersion版本，保证资源apiVersion与Kubernetes版本匹配。安装模板时，模板中的一些资源可能已经创建成功，因此首先要手动删除这些资源

 帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
调度策略 - 云容器引擎 CCE
调度策略 - 云容器引擎 CCE

如何让多个Pod均匀部署到各个节点上？如何避免节点上的某个容器被驱逐？为什么Pod在节点不是均匀分布？如何驱逐节点上的所有Pod？如何查看Pod是否使用CPU绑核？节点关机后Pod不重新调度如何避免非GPU/NPU负载调度到GPU/NPU节点？为什么Pod调度不到某个节点上？

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载

总条数： 1078

上一页
1
...
9
10
11
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

集群删除失败：安全组中存在残留资源 - 云容器引擎 CCE

工作负载异常：Pod一直处于Terminating状态 - 云容器引擎 CCE

kubelet性能配置 - 云容器引擎 CCE

调度器性能配置 - 云容器引擎 CCE

控制器性能配置 - 云容器引擎 CCE

集群过载保护最佳实践 - 云容器引擎 CCE

负载感知调度 - 云容器引擎 CCE

Headless Service - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

诊断项及修复方案 - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

Helm模板检查异常处理 - 云容器引擎 CCE

Docker Engine授权插件AuthZ权限绕过漏洞公告（CVE-2024-41110） - 云容器引擎 CCE

日志审计 - 云容器引擎 CCE

使用Kubectl命令进行命名空间RBAC授权 - 云容器引擎 CCE

通过配置容器内核参数增大监听队列长度 - 云容器引擎 CCE

监控 - 云容器引擎 CCE

模板格式不正确，无法删除模板实例？ - 云容器引擎 CCE

调度策略 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线