检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
io/not-ready:NoExecute 当Pod对这些污点存在容忍策略时,Pod不会进行重新调度,因此需要检查Pod对污点的容忍策略。 解决方案 通过查询Pod或者工作负载的yaml,查看容忍策略。一般情况下,工作负载的容忍度设置由以下字段组成: tolerations: - key: "key1" operator:
问题现象 节点池的状态一直处于“扩容中”,但是“操作记录”里面没有看到有对应创建节点的记录。 原因排查: 检查如下问题并修复: 租户是否欠费。 查看节点池配置的规格是否资源不足。 租户的ECS或内存配额是否不足。 如果一次创建节点太多,可能会出现租户的ECS容量校验不过的情况发生。 解决方案:
PVC按照社区逻辑实现,PVC本身的定义是存储声明,与底层存储解耦,不负责感知底层存储细节,因此没有感知底层存储故障的能力。 云监控服务CES 具备查看云服务监控指标的能力:云监控服务基于云服务自身的服务属性,已经内置了详细全面的监控指标。当用户在云平台上开通云服务后,系统会根据服务类型自
pvc-sfs-auto-example.yaml 命令执行完成后会在集群所在VPC内创建一个文件存储,您可以在“存储管理 > 文件存储卷”中查看该文件系统,也可以在SFS的控制台查看该文件系统。 父主题: 文件存储卷
轮转时间间隔表示向云凭据管理服务发起请求并获取最新的凭据的周期,合理的时间间隔范围为[1m, 1440m],默认值为2m。 单击“安装”。 待插件安装完成后,选择对应的集群,然后单击左侧导航栏的“插件中心”,可在“已安装插件”页签中查看相应的插件。 组件说明 表1 dew-provider组件
获取方法如下: 方法1:登录虚拟私有云服务的控制台界面,单击VPC下的子网,进入子网详情页面,查找IPv4子网ID。 方法2:通过虚拟私有云服务的查询子网列表接口查询。 链接请参见查询子网列表。 表12 ServiceNetwork 参数 参数类型 描述 IPv4CIDR String
fi done 执行保存好的脚本,查看输出。 如上图所示,则为/root/foo和/root/bar这两个文件夹的挂载点存在问题。 执行以下命令,查看卡死的挂载点。 mount -n | grep /root/foo 一般来说,此类卡死的挂载点表示已经没有业务使用,请您确认该挂载
在左侧导航栏选择“我的镜像”,单击右侧镜像名称,进入镜像详情页。 选择“触发器”页签,单击“添加触发器”,根据表1填写相关参数,然后单击“确定”。 图1 添加触发器 表1 触发器 参数 说明 触发器名称 自定义触发器的名称。 字母开头,由字母、数字、下划线_、中划线-组成,下划线
CCE的云原生告警能力是由AOM服务提供的,支持指标和事件的告警。同时,CCE集群详情中增加了告警中心能力,能支持快速配置资源等常用告警和告警查看。 图1 告警中心架构 告警中心 基于AOM服务的告警能力实现,提供集群内的告警快速检索、告警快速配置的能力。用户可以通过告警中心一键配置常用的告警规则。
管理”或“前往CCE集群管理”查看网格运行状态。 步骤2:一键创建Bookinfo应用 为集群开启应用服务网格功能后,可以通过“一键体验”创建一个Bookinfo应用Demo,具体操作如下: 登录应用服务网格ASM控制台。 选择左侧导航中的“服务列表”,单击“一键体验”。 图3 一键体验应用
工作负载异常:GPU节点部署服务报错 问题现象 在CCE集群的GPU节点上部署服务出现如下问题: 容器无法查看显存。 部署了7个GPU服务,有2个是能正常访问的,其他启动时都有报错。 2个是能正常访问的CUDA版本分别是10.1和10.0 其他服务CUDA版本也在这2个范围内 在
1.25及以上版本的集群中,ServiceAccount将不会自动创建对应的Secret。下面分别查看两种集群下的ServiceAccount状态。 1.25以前版本集群,查看名为default的ServiceAccount状态。 kubectl describe sa default
管过程中。 Upgrading:升级中,表示节点正处于升级过程中。 Active:运行中,表示节点处于正常状态。 Abnormal:不可用,表示节点处于异常状态。 Deleting: 删除中,表示节点正处于删除过程中。 Error:错误,表示节点处于故障状态。 lastProbeTime
pvc-evs-auto-example.yaml 命令执行完成后,会在集群所在分区创建EVS云硬盘,您可以在“存储管理 > 云硬盘存储卷”中查看该云硬盘,也可以在EVS的控制台根据卷名称查看该硬盘。 父主题: 云硬盘存储卷
管过程中。 Upgrading:升级中,表示节点正处于升级过程中。 Active:运行中,表示节点处于正常状态。 Abnormal:不可用,表示节点处于异常状态。 Deleting: 删除中,表示节点正处于删除过程中。 Error:错误,表示节点处于故障状态。 lastProbeTime
11以下的集群。 判断方法 在node节点上使用root用户执行containerd --version查看containerd版本。 新Console上的“节点管理”处也可以查看运行时版本。 漏洞修复方案 容器 entrypoint 使用 capsh工具去除自身的 Inheritable
管过程中。 Upgrading:升级中,表示节点正处于升级过程中。 Active:运行中,表示节点处于正常状态。 Abnormal:不可用,表示节点处于异常状态。 Deleting: 删除中,表示节点正处于删除过程中。 Error:错误,表示节点处于故障状态。 lastProbeTime
务手动删除。 弹性负载均衡资源 前往弹性负载均衡控制台。 通过集群使用的VPC ID进行过滤,得到该虚拟私有云下所有的弹性负载均衡实例。 查看负载均衡实例下的监听器详情,描述中包含集群ID、Service ID等信息,说明该监听器由此集群创建。 您可以根据上述信息将集群下残留的弹性负载均衡相关资源删除。
本文主要介绍在CCE在升级集群时,如何查找插件升级失败的原因,并解决问题。 操作步骤 插件升级失败后,请优先进行重试。若重试不成功,则根据后续步骤排查问题。 在升级界面显示失败后,请退出集群升级页面,前往“插件中心”界面查看插件的详细状态。针对异常的插件,单击插件名称查看详情。 在插件运行实例的
全地将节点上所有符合节点排水规则的Pod驱逐,后续新建的Pod都不会再调度到该节点,该排水时间取决于Pod情况,如时间过长,可返回节点列表查看事件。 确认退订弹窗后将跳转到订单页面,您可确认退订类别和金额后完成退订操作。 退订处理预计需要5-10分钟,在此期间,节点将处于不可用状态。