检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。 排查项一:节点是否存在资源压力 排查项二:是否在实例上设置了tolerations 排查项三:是否满足停止驱逐实例的条件 排查项四:容器与节点上的“资源分配量”是否一致 排查项五:工作负载实例不断失败并重新部署 排查项一:节点是否存在资源压力
估集群规模。 如需了解更多信息,请参见容器网络模型对比。 集群网段 集群中网络地址可分为节点网络、容器网络、服务网络三块,在规划网络地址时需要从如下方面考虑: 三个网段不能重叠,否则会导致冲突。且集群所在VPC下所有子网(包括扩展网段子网)不能和容器网段、服务网段冲突。 保证每个网段有足够的IP地址可用。
xgpu_core_percentage_used Gauge XGPU算力使用率 gpu_schedule_policy Gauge GPU模式分成0、1、2三种,具体说明如下: 0为显存隔离算力共享模式 1为显存算力隔离模式 2为默认模式表示当前卡还没被用于XGPU设备分配 xgpu_device_health
本管理工具(SCM)、构建工具结合使用。Jenkins可以很好的支持各种语言的项目构建,也完全兼容Maven、Ant、Gradle等多种第三方构建工具,同时跟SVN、GIT等常用的版本控制工具无缝集成,也支持直接对接GitHub等源代码托管网站。 约束与限制 该实践方案仅支持在CCE集群下部署,不适用专属云场景。
您需要在集群中创建支持GPU虚拟化的节点以使用GPU虚拟化功能,具体操作步骤请参见创建节点或创建节点池。 如果您的集群中已有符合前提条件的GPU节点,您可以跳过此步骤。 步骤三(可选):修改Volcano调度策略 Volcano针对GPU节点的调度策略默认为Spread,即如果节点配置相同,会选择一个正在运行的容器
您也可以选择自定义规格,通过选择不同的副本数、CPU配额和内存配额,来定制集群的CoreDNS参数规格。 单击“确定”,完成配置下发。 排查项三:解析外部域名很慢或超时 如果域名解析失败率低于1/10000,请参考解析外部域名很慢或超时,如何优化配置?进行参数优化,或在业务中增加重试。
自定义触发器的名称。 字母开头,由字母、数字、下划线_、中划线-组成,下划线、中划线不能连续且不能作为结尾,1-64个字符。 触发条件 支持如下三种触发条件,当镜像有新版本时,触发部署应用。 全部触发:有新的镜像版本生成或镜像内容发生更新时,触发部署。 指定版本号触发:有指定镜像版本生成或更新时,触发部署。
图1 解绑弹性公网IP 返回CCE控制台新增节点页面中,选择“使用已有”重新执行新增节点的操作。 方法二:提高弹性IP的配额。 排查项三:节点安全组是否被修改或删除 问题现象: 在CCE集群中新增节点时创建失败。 解决方法: 您可单击集群名称,查看“集群信息”页面。在“网络信
指定端口”,请填写30000-32767之间的整数,且确保集群内该值唯一。 外部访问:包括节点访问(通过弹性IP)、负载均衡和DNAT网关三种方式。 表2 外部访问类型说明 外部访问类型 说明 端口如何填写 节点访问(通过弹性IP) 为节点绑定弹性IP,访问工作负载时,通过“节点
如图1,同一个Region下可以有多个虚拟私有云(VPC)。虚拟私有云由一个个子网组成,子网与子网之间的网络交互通过子网网关完成,而集群就是建立在某个子网中。因此,存在以下三种场景: 不同集群可以创建在不同的虚拟私有云中。 不同集群可以创建在同一个子网中。 不同集群可以创建在不同的子网中。 图1 集群、VPC、安全组和节点的关系
0.0.0/8,172.16.0.0/12,192.168.0.0/16 三个网段的报文进行SNAT,因为这三个网段CCE默认为私有网段,可以借由上层VPC直接将报文送达(即将这三个网段视为集群内的网络,默认三层可达)。 默认:10.0.0.0/8,172.16.0.0/12,192
缩容门限判断时是否忽略daemonset型应用资源占用,默认false。 skipNodesWithCustomControllerPods 否 bool 节点上存在第三方controller创建容器时不进行缩容,默认true。 logLevel 否 int 日志级别,默认4。 multiAZEnable 否
则优使用节点已有的镜像,如果没有这个镜像再从镜像仓库拉取。 镜像名称 单击后方“选择镜像”,选择容器使用的镜像。 如果需要使用第三方镜像,请参见使用第三方镜像。 镜像版本 选择需要部署的镜像版本。 CPU配额 申请:容器需要使用的最小CPU值,默认0.25Core。 限制:允许容
略;低于Kubernetes 1.10版本,仅支持default、ClusterFirst和ClusterFirstWithHostNet三种。 “Default”不是默认的DNS策略。如果dnsPolicy的Flag没有特别指明,则默认使用“ClusterFirst”。 路由请求流程:
14-r0、v1.25.9-r0、v1.27.6-r0、v1.28.4-r0及以上。 CCE集群默认设置的非伪装网段说明 CCE集群默认会将以下三个知名私有网段作为非伪装网段(nonMasqueradeCIDRs): 10.0.0.0/8 172.16.0.0/12 192.168.0
取值范围: 密码复杂度要求: 长度为8-26位。 密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。 密码不能包含用户名或用户名的逆序。 默认取值: 不涉及 表7 NodeItem 参数 是否必选 参数类型 描述 uid 是 String
Network Interface,简称ENI)能力,采用VPC网段分配容器地址,支持ELB直通容器,享有高性能。 VPC网络 *控制节点数 3:三个控制节点,容灾性能好,在单个控制节点发生故障后集群可以继续使用,不影响业务功能。 1:单个控制节点,不建议在商用场景使用。 3 节点 OS类型
修复操作系统cgroup内核BUG导致概率出现的节点内存泄漏问题 v1.9.7-r1 主要特性: 增强PVC和PV事件的上报机制,PVC详情页支持查看事件 支持对接第三方认证系统 集群支持纳管EulerOS2.3的物理机 数据盘支持用户自定义分配比例 裸金属场景支持对接EVS云硬盘存储 裸金属场景下支持IB网卡
修复操作系统cgroup内核BUG导致概率出现的节点内存泄漏问题 v1.9.7-r1 主要特性: 增强PVC和PV事件的上报机制,PVC详情页支持查看事件 支持对接第三方认证系统 集群支持纳管EulerOS2.3的物理机 数据盘支持用户自定义分配比例 裸金属场景支持对接EVS云硬盘存储 裸金属场景下支持IB网卡
自定义指标监控支持四种配置方式。 方法一:配置Pod Annotations监控自定义指标 方法二:配置Service Annotations监控自定义指标 方法三:配置Pod Monitor监控自定义指标 方法四:配置Service Monitor监控自定义指标 方法五:使用AdditionalScrapeConfigs监控自定义指标