检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
工作负载异常问题排查 工作负载状态异常定位方法 工作负载异常:实例调度失败 工作负载异常:实例拉取镜像失败 工作负载异常:启动容器失败 工作负载异常:实例驱逐异常(Evicted) 工作负载异常:存储卷无法挂载或挂载超时 工作负载异常:一直处于创建中 工作负载异常:Pod一直处于Terminating状态
本文将为您介绍与节点池管理相关的最佳实践,包括节点池创建、管理和弹性伸缩等方面,从而更好地满足业务需求。 场景分类 相关最佳实践 创建节点池相关实践 制作CCE节点自定义镜像 创建节点时执行安装前/后脚本 创建节点时使用OBS桶实现自定义脚本注入 选择合适的节点数据盘大小 节点池日常管理实践 存储扩容 通过Core
查看方法:单击工作负载名称进入工作负载详情页,单击右上角的“日志”按钮可查看日志详情。日志约需要等待5分钟查看。 场景三:工作负载与节点时区同步 方法一:制作容器镜像时,将时区设置为CST。 方法二:若不希望修改容器,可在CCE控制台创建工作负载时,将本机的“/etc/localtime”目录挂载到容器
级高的业务SLO。 资源分级管控为业务潮汐明显的在线业务间混部、在线和离线业务混部奠定了基础。解决了应用预留资源较多、资源无法分时复用的问题。 在线作业与离线作业 从业务是否一直在线的角度看,其类型可分为在线作业和离线作业。 在线作业:一般运行时间长,服务流量呈周期性,资源存在潮
type: kubernetes.io/dockerconfigjson 获取.dockerconfigjson内容的步骤如下: 获取镜像仓库的登录信息: 镜像仓库地址:本文中以address为例,请根据实际信息替换。 用户名:本文中以username为例,请根据实际信息替换。 密码:本
Dockershim在1.20被标记为废弃,目前您可以继续在集群中使用Docker。该变动与集群所使用的容器镜像(Image)无关。您依然可以使用Docker构建您的镜像。更多信息,请参见Dockershim Deprecation FAQ。 参考链接 关于Kubernetes 1
节点运行时检查异常处理 节点池运行时检查异常处理 检查节点镜像数量异常处理 OpenKruise插件兼容性检查异常处理 Secret落盘加密特性兼容性检查异常处理 Ubuntu内核与GPU驱动兼容性提醒 排水任务检查异常处理 节点镜像层数量异常检查 检查集群是否满足滚动升级条件 轮转证书文件数量检查
并且建议先在测试环境试验迁移的影响,以最大限度避免可能存在的风险。 Containerd不具备镜像构建功能,请勿在Containerd节点上使用Docker Build功能构建镜像。Docker和Containerd其他差异请参考容器引擎说明。 默认节点池中的节点迁移步骤 登录CCE控制台,单击集群名称进入集群。
Dockershim在1.20被标记为废弃,目前您可以继续在集群中使用Docker。该变动与集群所使用的容器镜像(Image)无关。您依然可以使用Docker构建您的镜像。更多信息,请参见Dockershim Deprecation FAQ。 参考链接 关于Kubernetes 1
支持GPU渲染场景 支持v1.30集群 2.6.4 v1.28 v1.29 更新GPU卡逻辑隔离逻辑 2.6.1 v1.28 v1.29 升级GPU插件基础镜像 2.5.6 v1.28 修复安装驱动的问题 2.5.4 v1.28 支持v1.28集群 2.1.14 v1.21 v1.23 v1.25
find a match: socat 说明镜像未自带socat镜像,请手动下载rpm包,执行以下命令安装,其中rpm包名请根据实际情况进行替换: rpm -i socat-1.7.3.2-8.oe1.x86_64.rpm 表1 socat镜像rpm包下载地址 操作系统 下载地址 EulerOS
CCE容器网络扩展指标插件版本发布记录 节点本地域名解析加速插件版本发布记录 云原生监控插件版本发布记录 云原生日志采集插件版本发布记录 容器镜像签名验证插件版本发布记录 Grafana插件版本发布记录 OpenKruise插件版本发布记录 Gatekeeper插件版本发布记录 容器垂直弹性引擎版本发布记录
Containerd节点业务容器标准输出日志写入过快导致节点数据盘使用率过高 为什么kubectl top命令查看节点内存使用超过100%? CCE节点事件中一直出现“镜像回收失败”告警如何解决? 父主题: 节点
结果返回“Active” 属性是“active (running)”,表示启用了服务,受漏洞影响,需要尽快规避。 漏洞消减方案 华为云CCE集群节点OS镜像默认未安装CUPS服务,不受漏洞影响。 相关链接 https://www.evilsocket.net/2024/09/26/Attack
swr_region:SWR的区域,填写实际使用的region。 organization:SWR中的实际组织名称。 build_name:制作的镜像名称。 test_credential :添加到Jenkins的测试集群凭证,请填写凭证ID。如果需要部署在另一个集群,需要重新将这个集群
修改NetworkManager的配置 节点不可用 重置节点,具体请参见重置节点。 删除节点上的cce-pause等系统镜像 导致无法正常创建容器,且无法拉取系统镜像 请从其他正常节点复制该镜像恢复 在ECS侧对节点池下的节点进行规格变更 节点的规格与节点池定义的规格不一致,导致在弹性扩缩容时出现非预期现象(多扩或者少扩)
容器的名称为jobmanager image: apache/flink:1.20.0-scala_2.12 # 使用的Flink镜像,版本为1.20.0,Scala版本为2.12 args: ["jobmanager"] # 运行容器时传递的参数,指定这个容器运行为JobManager
步骤2:创建gRPC应用的工作负载 在集群中创建使用gRPC协议的工作负载。 复制以下YAML内容创建grpc.yaml文件。本文中使用官方示例应用构建的Docker镜像作为示例。 apiVersion: apps/v1 kind: Deployment metadata: annotations:
网络带宽上限较大,对于大带宽类的应用,资源利用率高。 多个容器可以运行在同一节点,容器间通信延迟低,减少网络传输。 拉取镜像的效率更高。因为镜像只需要拉取一次就可以被节点上的多个容器使用。而对于小规格的ECS拉取镜像的次数就会增多,在节点弹性伸缩时则需要花费更多的时间,反而达不到立即响应的目的。 另外,还需
Pod 拉取镜像失败 FailedPullImage 重要 检查Pod是否拉取镜像成功。 Pod 启动重试失败 BackOffStart 重要 检查Pod是否重启失败。 Pod 调度失败 FailedScheduling 重要 检查Pod是否调度成功。 Pod 拉取镜像重试失败 BackOffPullImage