检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装指标采集插件 在创建FederatedHPA策略前,您需要为集群安装支持Metrics API的插件,以采集工作负载相关指标的变动。如果您已经安装了相应插件,可跳过该步骤。 选择插件 UCS提供两种插件以采集工作负载相关指标:Kubernetes Metrics Server
域名访问 在多个集群中部署的应用可以通过公网域名实现统一的访问。您可以配置您的公网域名,UCS服务会以此域名作为根域名生成一个完整的应用外部访问域名。您可以通过发布域名访问,将服务,路由自动对接到华为云云解析DNS服务,以提供多云场景下应用的统一对外访问路径。同时域名访问提供了自
容忍策略 容忍策略允许调度器将Pod调度至带有对应污点的节点上,需要与节点污点配合使用。每个节点可以添加一个或多个污点,对于未设置节点容忍策略的Pod,调度器会根据集群上的污点效果进行选择性调度,以避免Pod被分配到不合适的节点上。 通过控制台配置容忍策略 登录UCS控制台。 在
执行kubectl命令报错Error from server (Forbidden)怎么办? 问题描述 在使用集群联邦的过程中,执行kubectl命令,出现如下所示的报错信息。 可能原因 可能是由于集群联邦内成员集群的资源对象ClusterRole或者ClusterRoleBin
##需要使用的npu卡数量 limits: cpu: 250m memory: 512Mi huawei.com/ascend-1980: '1' ##需要使用的npu卡数量
当选择发布用户为当前用户时,可以直接获取对应账号的UCS服务舰队信息。 当选择发布用户为其他用户时,可以通过配置项目与扩展点配置的IAM服务扩展点获取对应账号的UCS舰队信息。 图4 选择发布用户为当前用户 图5 选择发布用户为其他用户 表1 新建环境参数说明 参数 说明 环境名称 发布管理下环境唯一标识,创建后不可修改。
节点--XGPU设备显存使用率 节点--XGPU设备算力使用率 节点--XGPU设备数量 节点--XGPU设备显存分配量 GPU卡--XGPU设备显存使用率 GPU卡--XGPU设备显存分配量 GPU卡--XGPU设备显存分配率 GPU卡--XGPU设备算力使用率 GPU卡--XGPU设备数量
源需求也在不断变化。在部署、管理容器工作负载时,若时刻保持业务高峰期的资源数量,会造成大量的资源浪费;若为工作负载设置资源限制,则达到资源使用上限后可能会造成应用异常。Kubernetes中的HPA(Horizontal Pod Autoscaler)策略可基于监控资源指标变动实
在资源消耗TOP统计中,UCS服务会将CPU使用率和内存使用率排名前五的节点、无状态负载、有状态负载和Pod纳入统计范围,以帮助您识别资源消耗“大户”。 说明: CPU使用率 工作负载CPU使用率 = 工作负载各个Pod中CPU使用率的平均值 Pod CPU使用率 = Pod实际使用的CPU核数 / 业
伙伴云集群管理流程 接入网络模式 对于伙伴云集群,各集群提供商或本地数据中心对于网络入方向的端口规则有差异,防止特定端口外的入站通信。因此UCS使用集群网络代理的连接方式,无需在防火墙上启用任何入方向端口,仅通过集群代理程序的方式在出方向与UCS服务建立会话。 伙伴云集群接入网络的方法有两种,具有不同的优点:
json”文件)。 图1 kspider架构 kspider使用方法 kspider工具支持在Linux(x86、arm)和Windows环境中运行,使用方法相似。本文将以Linux(x86)环境为例进行介绍。 若使用Linux(arm)或Windows环境,请将下述命令中的ks
节点CPU的Limit检查是否超过150% 节点资源水位诊断 节点24小时内CPU使用率最大值是否超过80% 节点24小时内内存使用率最大值是否超过80% 节点磁盘使用率是否超过80% 节点PID使用量是否正常 节点24小时内是否发生OOM事件 负载 Pod状态 Pod状态检查 Pod负载状态
json”文件)。 图1 kspider架构 kspider使用方法 kspider工具支持在Linux(x86、arm)和Windows环境中运行,使用方法相似。本文将以Linux(x86)环境为例进行介绍。 若使用Linux(arm)或Windows环境,请将下述命令中的ks
述信息”,单击“确定”即可在控制台注销本地集群。 本地资源清理 该操作可能导致与该集群有绑定关系的资源(比如指定调度集群的负载等)无法正常使用,请谨慎操作,避免对运行中的业务造成影响。 在控制台注销并没有真正删除本地集群,您需要手动进入集群内完成删除过程。 复制注销之后控制台返回的卸载命令。
单击后方“选择镜像”,选择容器使用的镜像。 镜像版本 选择需要部署的镜像版本。 更新策略 镜像更新/拉取策略。可以勾选“总是拉取镜像”,表示每次都从镜像仓库拉取镜像;如不勾选则优使用节点已有的镜像,如果没有这个镜像再从镜像仓库拉取。 CPU配额 申请:容器需要使用的最小CPU值,默认0.25Core。
完成指标采集配置,本例中使用默认配置参数配置,如图3所示。 指标采集配置参数的具体说明可参考为附着集群开启监控。 图3 指标采集配置 单击“确认接入”,自动返回至“容器洞察 > 集群总览”页面,集群的接入状态为“安装中”。 等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配
管理流量策略 暂停调度策略 对于已创建的流量策略,如发生集群故障倒换等突发场景时,支持将某个调度策略暂停使用,待故障解除后再启用调度策略。下面以暂停调度策略为例进行说明,启用调度策略的方法与暂停一致,不再赘述。 登录UCS控制台,在左侧导航栏中单击“流量分发”。 在对应的调度策略框右上角位置单击“暂停”。
配置项的描述信息。 配置项数据 工作负载配置的数据可以在容器中使用,或被用来存储配置数据。 单击 ,输入键、值。其中,“键”代表配置名;“值”代表配置内容。 配置标签 标签以Key/value键值对的形式附加到各种对象上(如工作负载、节点、服务等)。 标签定义了这些对象的可识别属性,用来对它们进行管理和选择。
收集控制面组件日志 费用说明 LTS创建日志组免费,并每月赠送每个账号一定量免费日志采集额度,超过免费额度部分将产生费用。 约束与限制 华为云集群必须为v1.21.7-r0及以上补丁版本、v1.23.5-r0及以上补丁版本或1.25版本。 请确保云日志服务LTS资源配额充足,LTS的默认配额请参见基础资源。
流水线概述 流水线是华为云 CodeArts Pipeline 基于UCS容器舰队提供的多云场景下的自动化发布管理服务,提供调测、编排、发布、上线等一站式能力,帮助您建立敏捷高效的应用交付整体解决方案。 基于流水线对UCS容器舰队应用进行发布,可以实现在公有云、私有云、边缘云等多云场景下的跨云一站式应用发布。