检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
排水任务检查异常处理 节点镜像层数量异常检查 检查集群是否满足滚动升级条件 轮转证书文件数量检查 Ingress与ELB配置一致性检查 集群网络组件的NetworkPolicy开关检查 集群与节点池配置管理检查 Master节点时区检查 父主题: 升级集群
Master和Agent节点均可修改并发构建数量,此处以Master为例。 如果使用Master+Agent模式,建议将Master的并发构建数设置为0,即全部使用Agent进行构建。如果使用单Master模式,则无需修改为0。 修改执行并发构建的最大数目,示例中修改为2,您可根据实际需求并结合节点性能进行修改该值。
节点规格为“磁盘增强型”或“超高I/O型”时,有一块数据盘可以是本地盘。 本地磁盘实例有宕机风险,不保证数据可靠性,建议您使用云硬盘存储您的业务数据。 网络配置 表4 网络配置参数 参数 参数说明 虚拟私有云 默认为集群所在VPC,不可修改。 节点子网 节点子网默认使用创建集群时的子网配置,也可以选择其他子网。
io/pid-pressure:节点存在 PID 压力。 node.kubernetes.io/network-unavailable:节点网络不可用。 node.kubernetes.io/unschedulable:节点不可调度。 node.cloudprovider.kubernetes
容器组(Pod)是Kubernetes创建或部署的最小单位。一个Pod封装一个或多个容器(Container)、存储资源(Volume)、一个独立的网络IP以及管理控制容器运行方式的策略选项。 Pod使用主要分为两种方式: Pod中运行一个容器。这是Kubernetes最常见的用法,您可以
kubelet_volume_stats_inodes_used Gauge 卷中已使用的inode数 kubelet_volume_stats_inodes Gauge 卷中的最大inode数 kubelet_volume_stats_capacity_bytes Gauge 卷的容量(以字节为单位)
Worker),使用默认调度器,有可能会出现(a)、(b)、(c)三种情况的任意一种情况,(c)才是最想要的调度结果。因为在(c)中,Ps和Worker可以利用本机网络提供传输效率,缩短训练时间。 Volcano批量调度系统:加速AI计算的利器 Volcano是一款构建于Kubernetes之上的增强型高
将多个集群对接到同一个Prometheus监控系统,如下所示,节约维护成本和资源成本,且方便汇聚监控信息。 前提条件 目标集群已创建。 Prometheus与目标集群之间网络保持连通。 已在一台Linux主机中使用二进制文件安装Prometheus,详情请参见Installation。 操作步骤 分别获取目标集群的bearer_token
待纳管的云服务器所在VPC和子网需修改成节点池相同的VPC和子网。 更多操作指导请参见ECS切换虚拟私有云。 登录ECS控制台。 单击目标云服务器“操作”列下的“更多 > 网络/安全组 > 切换VPC”。 设置切换VPC参数。 虚拟私有云:选择需要切换的VPC。 子网:选择需要切换的子网。 私有IP地址:根据需求选择自动分配或使用已有IP。
crypt包有兼容性问题,如碰到无法执行的情况,请在Linux下执行。 Java 以下是Java环境下对密码进行加盐的示例步骤: 获取随机数作为生成盐值: private static String getCharAndNumr(int length) {
Pod正在使用的弹性网卡数 + 最大预绑定弹性网卡数 BMS节点上当预绑定弹性网卡数 < 最小预绑定弹性网卡数时:会绑定弹性网卡,使得预绑定弹性网卡数 = 最小预绑定弹性网卡数 BMS节点上当预绑定弹性网卡数 > 最大预绑定弹性网卡数时:会定时解绑弹性网卡(约2分钟一次),直到预绑定弹性网卡数
自定义监控数据需要保留的天数,默认为15天。 存储 支持云硬盘作为存储,按照界面提示配置如下参数: 可用区:请根据业务需要进行选择。可用区是在同一区域下,电力、网络隔离的物理区域,可用区之间内网互通,不同可用区之间物理隔离。 子类型:支持普通IO、高IO和超高IO三种类型。 容量:请根据业务需要输入存储容量,默认10G。
0/16,可用IP数量为65536,VPC网络IP分配是分配固定大小的网段(使用掩码实现,确定每个节点最多分配多少容器IP),例如上限为128,则此时集群最多支持65536/128=512个节点,然后去掉Master节点数量为509,此时是1.13集群支持的节点数。集群升级后,在此基础上3台M
集群部分参数配置 集群参数 参数值 集群类型 CCE Turbo集群 集群版本 1.29 Region 上海一 容器引擎 Containerd 网络模型 云原生网络2.0 服务转发模式 iptables 创建ClickHouse Operator。 下载官方提供yaml文件“clickhous
Pod正在使用的弹性网卡数 + 最大预绑定弹性网卡数 BMS节点上当预绑定弹性网卡数 < 最小预绑定弹性网卡数时:会绑定弹性网卡,使得预绑定弹性网卡数 = 最小预绑定弹性网卡数 BMS节点上当预绑定弹性网卡数 > 最大预绑定弹性网卡数时:会定时解绑弹性网卡(约2分钟一次),直到预绑定弹性网卡数
下: 扩容节点数 = 节点池容器组(Pod)资源申请值 / (单节点可用资源值 * 目标分配率) - 当前节点数 + 1 周期触发 触发时间:可选择每天、每周、每月或每年的具体时间点。 执行动作:达到触发时间值后所要执行的动作,为节点池增加指定数量的节点。 节点数范围:弹性伸缩时
C无法挂载。 处理EVS盘挂载任务的并发数(csi_attacher_worker_threads) 可视化界面配置 CCE容器存储插件(Everest)中同时处理挂EVS卷的worker数,默认值为“60”。 处理EVS盘卸载任务的并发数(csi_attacher_detach_worker_threads)
Pod监控检查方法 登录CCE控制台。 单击集群名称进入集群,在左侧选择“工作负载”。 单击工作负载操作列的“监控”,即可查看Pod的CPU、内存、网络I/O等监控大盘。 登录容器的方法 登录CCE控制台。 单击集群名称进入集群,在左侧选择“工作负载”。 单击指定工作负载名称,在工作负载实例列表中,单击操作列的“更多
节点的CPU非空闲时间所占的平均比例。 工作负载CPU使用率 = 工作负载各个Pod中CPU使用率的平均值 Pod CPU使用率 = Pod实际使用的CPU核数 / 业务容器CPU核数限制值之和(未配置限制值时采用节点总量) 内存使用率 节点内存使用率 = 节点的内存使用量除以节点的内存总量。 工作负载内存使用率
节点故障检测插件 problem_gauge{type="MountPointProblem"} >= 1 节点文件句柄数不足 检查系统关键资源FD文件句柄数是否充足 指标类 云原生监控插件 节点故障检测插件 problem_gauge{type="FDProblem"} >= 1