检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
域名解析 当访问外部域名时,Pod先使用集群的域名解析功能解析被访问目标的地址,后经过Pod侧的网络策略再进行访问,此时可能出现域名无法解析的情况,常见的报错有: Name or service not known。
1.17集群版本已停止维护,修复该问题建议升级至1.19及以上集群版本,并通过节点重置为最新版本的操作系统修复该问题,确保内核版本高于3.10.0-1062.12.1.el7.x86_64。 父主题: 操作系统问题说明
若您的集群版本不满足要求,建议您将集群升级至v1.19.16-r7、v1.21.9-r10、v1.23.7-r10及以上版本,再重置节点。 父主题: 节点运行
Ingress资源:一组基于域名或路径把请求转发到指定Service实例的访问规则,是Kubernetes的一种资源对象,通过接口服务实现增、删、改、查的操作。
从日志中可以看到每次请求cluster-1中ingress对应的域名时,都将其复制一份同样的请求转发到cluster-2中对应的服务中。 父主题: Nginx Ingress高级配置示例
手动配置的web-terminal权限在web-terminal插件升级时存在被重置风险,需注意做好备份在插件升级后重新配置。 使用kubectl修改clusterrolebinding配置需确保当前kubectl有修改clusterrolebinding资源操作权限。
解析外部域名很慢或超时,如何优化配置? 存储管理 无法使用kubectl命令删除PV或PVC 如何扩容容器的存储空间? API&kubectl kubectl使用报错:Error from server (Forbidden) 镜像仓库 如何制作Docker镜像?
结果返回“Active” 属性是“inactive (dead)”,表示已安装但未启用服务,不受漏洞影响但涉及,需要升级CUPS。 结果返回“Active” 属性是“active (running)”,表示启用了服务,受漏洞影响,需要尽快规避。
集群master节点升级失败,不支持取消升级任务,请您优先尝试重试升级或联系技术支持。 400 CCE.02400001 Invalid request. 请求体不合法。 请参考返回的message和CCE接口文档修改请求体,或联系技术支持。
如何解决yum update升级操作系统导致的容器网络不可用问题? Node节点vdb盘受损,通过重置节点仍无法恢复节点? CCE集群节点中安装kubelet的端口主要有哪些? 如何配置Pod使用GPU节点的加速能力? 容器使用SCSI类型云硬盘偶现IO卡住如何解决?
CRD验证表达式语言升级为Beta阶段 CRD验证表达式语言已升级为 beta 版本, 这使得声明如何使用通用表达式语言(CEL)验证自定义资源成为可能。 请参考验证规则指导。
如果在GPU节点存在GPU虚拟化负载时,对插件进行升级或回退操作后,需要对GPU节点的进行排水,具体操作请参见文档“常见问题 > 模板插件 > CCE AI套件(NVIDIA GPU)插件升级后,如何对GPU节点进行排水” 。
CRD验证表达式语言升级为Beta阶段 CRD验证表达式语言已升级为 beta 版本, 这使得声明如何使用通用表达式语言(CEL)验证自定义资源成为可能。 请参考验证规则指导。
若您的集群版本不满足要求,请将集群升级到上述指定的版本后,再将节点重置为最新版本的操作系统。 父主题: 操作系统问题说明
若您的集群版本不满足要求,请将集群升级到上述指定的版本后,再将节点重置为最新版本的操作系统。 父主题: 操作系统问题说明
nvidia-container-toolkit CVE-2024-0132容器逃逸漏洞 2.7.13 v1.28 v1.29 v1.30 支持节点池粒度配置XGPU 支持GPU渲染场景 支持v1.30集群 2.6.4 v1.28 v1.29 更新GPU卡逻辑隔离逻辑 2.6.1 v1.28 v1.29 升级
请通过console页面或API修改容器网卡动态预热参数配置,请勿直接后台修改节点annotations上对应的容器网卡动态预热参数,集群升级后,后台直接修改的annotations会被覆盖为原始的值。
CCE提供的集群相关功能包括:购买集群、连接集群、升级集群、删除集群、集群休眠与唤醒、集群监控和集群权限控制等。
解决方法 通过重置节点将内核升级至高版本,具体请参见重置节点。 父主题: 节点运行
定期检查集群风险 集群诊断健康提炼了运维专家提供的高频故障案例,分别从如下方面进行检查: 维度 检查项 运维层面 集群运维能力 集群安全组配置正确性 集群资源规划合理性 租户配额是否充足 资源与业务层面 存储插件(everest)健康程度 日志采集插件(log-agent)健康程度 域名解析插件