检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“创建”,创建完成后系统会自动分发策略,如果分发成功,策略实例将在集群中生效。 策略实例分发成功后可在集群中执行符合策略实例的动作,此时该动作可正常执行;若在集群中执行不符合策略实例的动作,该动作将被拒绝掉或者上报告警事件。 修改/删除策略实例 作为平台工程师,您通常需要定期审视和更新策略实例,或者
用户订阅服务后,可通过控制台选择指定的集群进行实例的创建,可以自定义将实例分发到不同区域下的目标集群。 约束与限制 已添加一个可用集群,集群版本为v1.15及以上,且集群中至少包含一个可用节点。 部分服务只支持特定的CPU架构,只能部署到对应CPU架构的集群中。 操作步骤 需要存储资源的
置。 如何进入集群的管理控制台 舰队中的集群和未加入舰队的集群,进入集群控制台的方法不同,分别如下所述: 舰队中的集群:在“容器舰队”页面选择目标集群所在的舰队,单击舰队名称进入详情页,选择左侧导航栏的“容器集群”,单击目标集群名称进入集群控制台。 未加入舰队的集群:在“未加入舰
子路径:Kubernetes中数据卷挂载的subPath,指引用卷内的子路径而不是其根路径。该参数不填写时,默认挂载至根路径。 设置权限。 只读:只能读容器路径中的数据卷。 读写:可修改容器路径中的数据卷,容器迁移时新写入的数据不会随之迁移,会造成数据丢失。 重复添加可增加多条存储卷声明设置。
工作负载 创建工作负载 容器设置 管理工作负载 父主题: 集群联邦
服务与路由 服务与路由概述 服务(Service) 路由(Ingress) 父主题: 集群联邦
要使用Metallb的集群。按照页面引导完成安装。 功能验证 进入UCS内的集群控制台。 如果是未加入舰队集群,直接单击集群名即可进入集群控制台。 如果是已加入容器舰队的集群,先进入对应容器舰队控制台,选择左侧 “集群管理”内的“容器集群”,再进入对应集群控制台。 左侧导航栏内选择“工作负载”,单击镜像创建。
containerd 插件 集群中需要同时安装以下插件: volcano插件:1.10.1及以上版本 gpu-device-plugin插件:2.0.0及以上版本 步骤一:纳管并标记GPU节点 如果您的集群中已有符合基础规划的GPU节点,您可以跳过此步骤。 在集群中纳管支持GPU虚拟化的节点,具体操作步骤请参见纳管节点。
使用GPU虚拟化后,该GPU节点不再支持调度使用共享GPU资源的工作负载。 通过控制台创建GPU应用 登录UCS On Premises集群控制台。 单击集群名称进入集群,在左侧选择“工作负载”,在右上角单击“镜像创建”。 配置工作负载信息。在“容器配置>基本信息”中选择异构资源为GPU,然后选择资源使用模式:
完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。 单击集群名称,进入“容器洞察”总览页面。 选择“仪表盘”,在“集群视图”旁单击“切换视
连接到集群,详情请参见通过kubectl连接集群。 约束与限制 当前不支持npu负载多容器能力。 通过控制台创建NPU应用 本节以创建无状态工作负载(Deployment)为例,说明通过控制台创建npu资源应用的方法。 登录UCS控制台,选择容器舰队,单击集群名称进入集群。 左侧导航栏中选择“工作负载
否存在。如果容器的存活检查失败,集群会对该容器执行重启操作;若容器的存活检查成功则不执行任何操作。 就绪探针:readinessProbe,用于检查用户业务是否就绪,如果未就绪,则不转发流量到当前实例。一些程序的启动时间可能很长,比如要加载磁盘数据或者要依赖外部的某个模块启动完成
GPU视图 集群 集群-显存使用率 集群-算力使用率 节点-显存使用量 节点-显存使用率 节点-算力使用率 GPU卡-显存使用量 GPU卡-算力使用率 GPU卡-温度 GPU卡-显存频率 GPU卡-PCle带宽 XGPU视图 集群 集群--XGPU设备显存使用率 集群--XGPU设备算力使用率
域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等
为集群开启监控 集群监控概述 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控 为多云集群开启监控 为伙伴云集群开启监控 修改监控配置 关闭监控 父主题: 容器智能分析
右上角状态重新显示为“集群联邦能力已开通”表明升级成功,您可以在舰队基本信息中查看新的版本号。 右上角状态显示为“集群联邦能力升级失败”表明升级失败,请执行集群联邦版本回退。 回退集群联邦 若联邦版本升级失败,UCS支持重新对集群联邦进行升级,或将集群联邦回退至原有版本。 若未出现集群联邦升级失败情况,则联邦版本不可回退。
式。 自建集群 如果您的集群是通过Kubernetes官方二进制文件或Kubeadm等部署工具搭建的标准集群,可直接使用以下方法获取KubeConfig文件。 该方法不适用于云服务商提供的商用集群,商用集群的KubeConfig文件获取请参考第三方云厂商集群。 登录集群Master节点。
集群联邦版本发布记录 表1 UCS集群联邦版本发布记录 UCS集群联邦版本号 支持的集群版本 更新特性 当前状态 UCS集群联邦版本商用时间 UCS集群联邦版本EOS(停止服务时间) v1.10.7-r6 v1.19~v1.30 支持Kubernetes 1.30集群版本 支持MCI配置service维度的健康检查
服务(Service) 集群内访问(ClusterIP) 节点访问(NodePort) 负载均衡(LoadBalancer) 父主题: 服务与路由
API时,前者生效;使用KubeConfig直接操作联邦时,后者生效。 在集群联邦和成员集群上分别创建的RBAC资源互相不感知、不影响。通过集群联邦入口配置的RBAC权限仅直接访问联邦时生效;直接访问成员集群时,仅成员集群上配置的RBAC生效。 在分配细粒度鉴权时,谨慎使用ClusterRole、ClusterRo