检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本地集群配置文件 管理本地集群节点 管理本地集群网络 升级本地集群 注销本地集群 使用ucs-ctl命令行工具管理本地集群 GPU调度 NPU调度 备份与恢复 父主题: 本地集群
在该协议下允许同一个IP地址和端口号下对外提供多个基于TLS的访问域名,且不同的域名可以使用不同的安全证书。 转发策略配置:请求的访问地址与转发规则匹配时(转发规则由域名、URL组成,例如:10.117.117.117:80/helloworld),此请求将被转发到对应的目标Service处理。您可添加多条转发策略。
服务与路由概述 集群为满足多种复杂场景下的工作负载访问,提供了不同的访问方式,从而满足不同的业务需求。 通过UCS控制台创建服务(Service)、路由(Ingress)后,每个关联工作负载的所属集群中都会创建一个同名的Service、Ingress。 您可以在集群中对UCS自动
配置调度与差异化 集群调度策略 当前界面支持集群权重和自动均衡两种策略。 通过控制台配置调度策略 登录UCS控制台。 在创建工作负载时,单击“下一步:调度与差异化”。 添加调度策略。 表1 调度策略 策略 描述 集群权重策略 需要您选择集群并配置分发权重,按照集群权重配比分发Pod。
训练、深度学习GPU或共享GPU的训练与推理。 负载伸缩实现机制 UCS的负载伸缩能力是由FederatedHPA和CronFederatedHPA两种负载伸缩策略所实现的,如图1所示。 创建FederatedHPA策略,支持基于系统指标与自定义指标对工作负载进行扩缩。指标到达所配置的期望值时,触发工作负载扩缩。
登录UCS控制台,在左侧导航栏中选择“容器舰队”。 在“容器舰队”页签下找到已开通集群联邦的舰队,单击名称进入详情页。 在左侧导航栏中选择“服务与路由”,选择“路由”页签。 选择需要创建路由的命名空间,并单击右上角“创建路由”。如需新建命名空间,请参见创建命名空间。 图1 选择命名空间
请确保同个集群内的端口唯一性。 设置完成后,单击“确认”。 单击“下一步:调度与差异化”,进行集群调度与差异化配置。设置完成后,单击“创建工作负载”完成创建。 获取访问地址。 单击左侧导航栏“服务与路由”,选择“服务”页签。 单击所添加的Service名称进入“服务详情”界面,
修改集群监控配置。 词条 词条简介 集群概况 集群概况展示了舰队内集群的名称、风险等级、当前运行状态、类型、所在区域、CPU/内存的使用率与分配率等信息,且单击上方搜索框,选择属性类型,再输入对应的关键字,即可查询该条件下的集群。 集群风险概览 集群风险概览是容器智能分析针对集群
别创建对应的命名空间。或者按照不同的业务创建对应的命名空间,例如系统若分为登录和游戏服务,可以分别创建对应命名空间。 若创建的网格命名空间与舰队集群中的命名空间一致,则asm-mesh-controller插件会自动同步服务、服务实例到网格。 asm-mesh-controlle
对于附着集群、本地集群和多云集群,UCS中的集群控制台提供基本的Kubernetes资源管理能力,例如管理集群内的节点、工作负载、服务与路由、容器存储、配置项与密钥、命名空间等资源。 附着集群和本地集群的控制台权限由UCS进行单独管理,需要华为云账号或具备UCS FullAccess权限
要手动配置,underaly网络相关介绍与操作请参见Cilium。 支持 多云集群 多云集群 同时支持overlay和underlay网络。 默认为overlay网络,要启用underaly网络需要手动配置,underaly网络相关介绍与操作请参见Cilium。 支持 附着集群 附着集群
过身份认证。 AK(Access Key ID):访问密钥ID。与私有访问密钥关联的唯一标识符;访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):私有访问密钥。与访问密钥ID结合使用,对请求进行加密签名,可标识发送方,并防止请求被修改。
有状态负载 守护进程集 任务和定时任务 容器组 设置容器规格 设置容器生命周期 设置容器健康检查 设置环境变量 工作负载升级配置 调度策略(亲和与反亲和) 容忍策略 父主题: 单集群管理
约束与限制 华为云UCS对单个用户的资源数量和容量限定了配额,默认情况下,您最多可以创建50个舰队、50个集群、50个权限策略。如果您需要创建更多资源,请参考UCS有哪些配额限制申请扩大配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
添加标签“accelerator/huawei-npu”,标签值可为空。 添加NPU节点标签 依次单击“本地集群>节点管理>选择节点>标签与污点管理”。 选择NPU节点,添加标签“accelerator/huawei-npu”,标签值可为空。 图1 添加npu插件标签 单击“确定”完成npu节点标签添加。
集群类别与类型说明 集群类别(category) 集群类型(type) provider供应商 华为云集群(self) CCE Standard集群(cce) huaweicloud CCE Turbo集群(turbo) huaweicloud 本地集群(onpremise) 本地集群(baremetal)
已购买资源包,为什么仍然产生按需计费? 请按表1识别产生按需计费的原因,并重新选择正确的资源包或保证账户中的余额充足。 表1 排查思路 可能原因 处理措施 购买套餐包中集群类型与实际接入的集群类型不一致 购买所接入集群类型对应的套餐包 购买套餐包中集群规模小于实际接入的集群规模 购买集群规模更大的、符合所接入集群规模的套餐包,或保证账户中的余额充足
准备GPU资源 本文介绍如何在使用GPU能力前所需要的基础软件、硬件规划与准备工作。 基础规划 配置 支持版本 集群版本 v1.25.15-r7及以上 操作系统 华为云欧拉操作系统 2.0 系统架构 X86 GPU类型 T4、V100 驱动版本 GPU虚拟化功能仅支持470.57
kspider工具的架构如图1所示,包含三个模块:采集模块、连接管理和分析模块。采集模块可以收集源集群的数据,包括命名空间、工作负载、节点、网络等;连接管理模块负责与源集群的API Server建立连接;分析模块分为聚合输出和评估推荐两部分,旨在输出源集群的采集数据(生成“cluster-*.json”文
kspider工具的架构如图1所示,包含三个模块:采集模块、连接管理和分析模块。采集模块可以收集源集群的数据,包括命名空间、工作负载、节点、网络等;连接管理模块负责与源集群的API Server建立连接;分析模块分为聚合输出和评估推荐两部分,旨在输出源集群的采集数据(生成“cluster-*.json”文