检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果修改配置项(例如将容器应用的密码、证书、环境变量配置到容器中),当容器重启(例如节点异常重新调度Pod)后,会导致配置丢失,业务异常。 配置信息应通过入参等方式导入容器中,以免重启后配置丢失。 环境变量支持如下几种方式设置。 自定义:自行填写变量名称及变量值。
如何确认集群连通 VPC网段之间的网络连通 登录云容器引擎控制台,选择本端集群,进入集群详情页,单击左侧导航栏“节点管理”,进入节点详情页。 单击“节点名称”下的节点,在弹出的页面中单击右上角“远程登录”,选择VNC方式登录。
表1 常用命令 命令 解释 config generator 提供集群、节点的创建模板 create 创建集群或者添加节点 delete 删除集群或者移除节点 get 获取本地集群信息 help 帮助信息 version ucs-ctl版本信息 参数说明 ucs-ctl config
K8s事件显示节点的CPU或内存资源不足,请您扩容节点资源。 K8s事件显示没有符合调度规则的节点。proxy-agent为实现高可用性,默认将两个实例调度至不同的节点,请您确保集群中至少存在两个节点具有足够的资源。
-显存使用量 节点-显存使用率 节点-算力使用率 GPU卡-显存使用量 GPU卡-算力使用率 GPU卡-温度 GPU卡-显存频率 GPU卡-PCle带宽 XGPU视图 集群 集群--XGPU设备显存使用率 集群--XGPU设备算力使用率 节点--XGPU设备显存使用率 节点--XGPU
节点访问(NodePort) 表示工作负载可以从集群外部访问。节点访问 ( NodePort )是指在每个节点的IP上开放一个静态端口,通过静态端口对外暴露服务。当集群中的节点绑定了EIP时,通过请求<EIP>:<NodePort>,也可实现从公网访问工作负载。
图1 状态校验失败 解决方案 如果出现以上问题,请检查报错的VPC中所有的子网下,是否已经存在自行创建的绑定至报错的终端节点服务的VPCEP终端节点,如果有,请至该绑定终端节点服务的VPCEP终端节点的详情页面并给其添加标签"managed-by=service-ucs"。
优先模式:优先将插件的Deployment实例调度到不同可用区的节点上,如集群下节点不满足多可用区,插件实例将调度到单可用区。 强制模式:插件Deployment实例强制调度到不同可用区的节点上,如集群下节点不满足多可用区,插件实例将无法全部运行。 配置插件实例节点亲和策略。
如何手动清理本地集群节点? 如何进行Cgroup降级? 虚拟机SSH连接超时怎么办? 本地集群如何扩容容器智能分析插件的存储磁盘? Master节点关机后集群控制台不可用怎么办? 节点扩容规格后未就绪怎么办? 如何更新本地集群ca/tls证书? 本地集群安装失败怎么办?
manage节点在本地集群内使用tag和taint进行管理,因此对manage节点进行扩容只需要为集群内非manage节点打上标签和污点即可,具体步骤如下: 进入UCS集群控制台,单击左侧导航栏内的“节点管理”。 选中待转的非manage节点并单击“标签与污点管理”。
如果您接入的集群中包含超大容量的节点,并且希望其不被统计在UCS控制台集群列表上的CPU和内存分配率指标中,那么需要为这个节点打上“type:virtual-kubelet”标签,以便您准确识别集群资源分配情况。为集群节点打标签请参照为节点添加标签/污点。 父主题: UCS集群
容忍策略:当工作负载实例所在的节点不可用时,系统将实例重新调度到其它可用节点的时间窗,默认为300秒。 容忍策略与节点的污点能力配合使用,允许(不强制)负载调度到带有与之匹配的污点的节点上,也可用于控制负载所在的节点被标记污点后负载的驱逐策略,详细内容请参考示例教程。
容忍策略:当工作负载实例所在的节点不可用时,系统将实例重新调度到其它可用节点的时间窗,默认为300秒。 容忍策略与节点的污点能力配合使用,允许(不强制)负载调度到带有与之匹配的污点的节点上,也可用于控制负载所在的节点被标记污点后负载的驱逐策略,详细内容请参考示例教程。
集群规模 源集群节点数<25,推荐50节点规模 25≤源集群节点数<100,推荐200节点规模 100≤源集群节点数<500,推荐1000节点规模 源集群节点数≥500,推荐2000节点规模 CPU+内存 统计数量最多的那一种规格 架构 统计数量最多的那一种规格 OS内核版本 统计数量最多的那一种规格
节点访问(NodePort) 表示工作负载可以从集群外部访问。节点访问 ( NodePort )是指在每个节点的IP上开放一个静态端口,通过静态端口对外暴露服务。当集群中的节点绑定了EIP时,通过请求<EIP>:<NodePort>,也可实现从公网访问工作负载。
节点访问(NodePort):可以通过集群内任意节点访问到服务。 服务亲和(仅节点访问设置): 集群级别:集群下所有节点的IP+访问端口均可以访问到此服务关联的负载,服务访问会因路由跳转导致一定性能损失,且无法获取到客户端源IP。
私网接入的集群必填,且必须是打通线下集群的VPC终端节点。 创建VPC终端节点及查询IP地址的方法请参见创建终端节点。
数量 CPU (Cores) Mem (GiB) root盘 非root盘 备注 集群管理节点 3 8 32 100 200 t3.2xlarge型号 集群计算节点 按需 8 32 100 200 数量按需可扩展 表3 IAM权限 权限类型 权限名称 IAMRole AWSIAMRoleNodes
表1 资源的名称和数量 控制台 资源类型 数量 名称 EC2面板 EC2 控制节点:3 工作节点:n 控制节点:${clusterName}-cp-${random5} 工作节点:${clusterName}-md-${i}-${random5},其中${i}默认为0 安全组 5
集群规模 源集群节点数<25,推荐50节点规模 25≤源集群节点数<100,推荐200节点规模 100≤源集群节点数<500,推荐1000节点规模 源集群节点数≥500,推荐2000节点规模 CPU+内存 统计数量最多的那一种规格 架构 统计数量最多的那一种规格 OS内核版本 统计数量最多的那一种规格