检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
满足上述漏洞利用条件时,容器进程可能逃逸到节点,导致节点信息泄露或执行恶意命令。 典型漏洞利用场景 攻击者具有集群工作负载的创建或更新权限,创建工作负载时设置容器进程的WORKDIR为/proc/self/fd/<num>,以实现在容器运行后访问节点文件系统。 工作负载的容器镜像来源不
只读权限 对华为云集群及所有集群资源对象(包含节点、工作负载、任务、服务等)的只读权限。 UCS ReadOnlyAccess + CCE Administrator 本地/附着集群 管理员权限 对本地/附着集群及所有集群资源对象(包含节点、工作负载、任务、服务等)的读写权限。 UCS
集群-算力使用率 节点-显存使用量 节点-显存使用率 节点-算力使用率 GPU卡-显存使用量 GPU卡-算力使用率 GPU卡-温度 GPU卡-显存频率 GPU卡-PCle带宽 XGPU视图 集群 集群--XGPU设备显存使用率 集群--XGPU设备算力使用率 节点--XGPU设备显存使用率
---------------+ 预期输出表明,该容器被分配显存总量为5000 MiB,实际使用了4792MiB。 查看所在节点的GPU显存隔离情况(在节点上执行)。 export PATH=$PATH:/usr/local/nvidia/bin;nvidia-smi 预期输出:
单集群管理 单集群管理概述 节点管理 工作负载 服务与路由 容器存储 配置项与密钥 KubeConfig 自定义资源 命名空间 工作负载弹性伸缩(HPA) 插件管理 组件管理 父主题: UCS集群
处于这个命名空间。 kube-node-lease:每个节点在该命名空间中都有一个关联的“Lease”对象,该对象由节点定期更新。NodeStatus和NodeLease都被视为来自节点的心跳,在v1.13之前的版本中,节点的心跳只有NodeStatus,NodeLease特性从v1
本地集群 创建终端节点以私网接入本地集群 使用工作负载Identity安全访问云服务
容器洞察 容器洞察概述 查看舰队总览 查看集群情况 查看集群内节点情况 查看集群内工作负载情况 查看集群内Pod情况 查看集群内事件情况 父主题: 容器智能分析
es资源对象(包含节点、工作负载、任务、服务等)的只读权限。 UCS ReadOnlyAccess + CCE Administrator 本地/附着/多云/伙伴云集群 管理员权限 本地/附着/多云/伙伴云集群及集群下所有Kubernetes资源对象(包含节点、工作负载、任务、服务等)的读写权限。
镜像版本 选择需要部署的镜像版本。 更新策略 镜像更新/拉取策略。勾选“总是拉取镜像”表示每次都从镜像仓库拉取镜像;如不勾选则优先使用节点已有的镜像,如果没有这个镜像再从镜像仓库拉取。 CPU配额 申请:容器需要使用的最小CPU值,默认0.25Core。 限制:允许容器使用的
具完整性校验操作步骤。 表1 常用命令 命令 解释 config generator 提供集群、节点的创建模板 create 创建集群或者添加节点 delete 删除集群或者移除节点 get 获取本地集群信息 help 帮助信息 version ucs-ctl版本信息 参数说明 ucs-ctl
的能力,可正常拉取SWR镜像。 K8s事件显示节点的CPU或内存资源不足,请您扩容节点资源。 K8s事件显示没有符合调度规则的节点。proxy-agent为实现高可用性,默认将两个实例调度至不同的节点,请您确保集群中至少存在两个节点具有足够的资源。 K8s事件显示gatekeep
Not Implemented 请求未完成。服务器不支持所请求的功能。 502 Bad Gateway 请求未完成。服务器从上游服务器收到一个无效的响应。 503 Service Unavailable 请求未完成。系统暂时异常。 504 Gateway Timeout 网关超时。 父主题:
容量:创建PVC时指定的容量大小,此容量仅供参考,实际容量为本地目录所在盘的可用容量。 节点:指定普罗服务准备调度的节点,需确保普罗服务可调度到此节点。 节点目录:指定普罗服务存储数据的目录,请输入绝对路径,该路径将在目标节点自动创建。 关于插件的详细说明请参见kube-prometheus-stack插件。
String 状态信息 表13 NodeSummary 参数 参数类型 描述 totalNum String 集群中所有节点的个数。 readyNum String 集群中已就绪节点的数量。 表14 ResourceSummary 参数 参数类型 描述 allocatable map<string
解决方案 如果出现以上问题,请检查报错的VPC中所有的子网下,是否已经存在自行创建的绑定至报错的终端节点服务的VPCEP终端节点,如果有,请至该绑定终端节点服务的VPCEP终端节点的详情页面并给其添加标签"managed-by=service-ucs"。 父主题: 集群联邦
String 状态信息 表12 NodeSummary 参数 参数类型 描述 totalNum String 集群中所有节点的个数。 readyNum String 集群中已就绪节点的数量。 表13 ResourceSummary 参数 参数类型 描述 allocatable map<string
本地集群 本地集群接入失败怎么办? 如何手动清理本地集群节点? 如何进行Cgroup降级? 虚拟机SSH连接超时怎么办? 本地集群如何扩容容器智能分析插件的存储磁盘? Master节点关机后集群控制台不可用怎么办? 节点扩容规格后未就绪怎么办? 如何更新本地集群ca/tls证书?
Pod列表 Pod列表中包含了实例名称、状态、命名空间、实例IP、所在节点、重启次数、CPU申请/限制、内存申请/限制,以及CPU和内存使用率等详细信息。 您可以通过在列表上方按照实例名称、状态、命名空间、实例IP和所在节点进行筛选,快速找到需要的实例。 在列表的右上角,您可以单击按钮来
如果您接入的集群中包含超大容量的节点,并且希望其不被统计在UCS控制台集群列表上的CPU和内存分配率指标中,那么需要为这个节点打上“type:virtual-kubelet”标签,以便您准确识别集群资源分配情况。为集群节点打标签请参照为节点添加标签/污点。 父主题: UCS集群