检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU调度概述 工作负载支持使用节点GPU资源,GPU资源使用可以分为如下两种模式: GPU静态分配(共享/独享):按比例给Pod分配GPU显卡资源,支持独享(分配单张/多张显卡)和共享(部分显卡)方式。 GPU虚拟化:UCS On Premises GPU采用xGPU虚拟化技术
LTS日志组结构化是否创建成功 节点 节点状态 节点状态是否就绪 节点状态不可调度 节点kubelet状态 节点配置 节点内存的Requset是否超过80% 节点CPU的Request是否超过80% 节点内存的Limit检查是否超过150% 节点CPU的Limit检查是否超过150% 节点资源水位诊断
Node IP 必填,节点IP地址 Node Role 必填,节点角色(选填master/node) User 必填,节点登录用户 Password 选填,节点登录密码 Auth Type 选填,节点认证类型(选填password/key) Key Path 选填,节点登录密钥路径 样例如下:
Node IP 必填,节点IP地址 Node Role 必填,节点角色(选填master/node) User 必填,节点登录用户 Password 选填,节点登录密码 Auth Type 选填,节点认证类型(选填password/key) Key Path 选填,节点登录密钥路径 样例如下:
收集控制面组件日志 费用说明 LTS创建日志组免费,并每月赠送每个账号一定量免费日志采集额度,超过免费额度部分将产生费用。 约束与限制 华为云集群必须为v1.21.7-r0及以上补丁版本、v1.23.5-r0及以上补丁版本或1.25版本。 请确保云日志服务LTS资源配额充足,LTS的默认配额请参见基础资源。
WorkerConfig object 工作节点配置,仅支持多云集群 表6 WorkerConfig 参数 是否必选 参数类型 描述 replicas 否 Integer 节点个数 strategy 否 NodeUpgradeStrategy object 节点更新策略 表7 NodeUpgradeStrategy
选择对应的VPC终端节点。若不存在可用的VPC终端节点,单击“创建终端节点”以创建VPC终端节点。再次提交工单云日志服务(LTS)的VPC终端节点需要经过LTS服务审批,操作方法请参见步骤一:云日志服务VPC终端节点授权。 创建的VPC终端节点需要和本地集群节点在同一个虚拟私有云或建立对等连接。
命名空间:选择命名空间。 目标服务:选择目标服务,若您还没有可以关联的LoadBalancer类型的服务,请先创建服务。详细创建服务步骤见负载均衡(LoadBalancer)。 单击“下一步”,配置访问模式。 主备模式:流量只会解析到您所选择的主集群中,可以通过修改流量配比功能,修改主备集群。
S系统,可执行yum install bind-utils安装。 如下图所示,回显中“ANSWER SECTION”的IP地址为目标集群负载均衡IP,则表示调度策略创建成功。 父主题: 流量分发
name clusterName”或“cluster(clusterName) is joined successfully”。 可能原因 集群节点故障、Pod重启导致加入失败,由于karmadactl join命令不幂等,失败后再次执行会报错。 解决方案 请将集群从联邦中移出,然后执行kubectl
修改源代码 修改应用服务 如图1,现需要将集群下podinfo服务的访问类型由“集群内访问”改为“节点访问”,将其端口暴露到现网,具体操作如下: 图1 服务列表 进入配置集合源代码仓库,根据根据配置集合仓库源信息,找到并打开podinfo/kustomize路径下的service
创建联邦网络连接并下载联邦kubeconfig 功能介绍 舰队开通联邦后,调用此接口,创建vpcep终端节点,连接到联邦apiserver,并下载联邦apiserver的kubeconfig URI POST /v1/clustergroups/{clustergroupid}/cert
Operator和Prometheus,提供简单易用的端到端Kubernetes集群监控能力,同时还具备自定义插件规格、对接Grafana、高可用、节点亲和等能力。 kube-prometheus-stack插件的核心组件包括prometheusOperator、prometheus、al
-nmonitoring|grep volume.kubernetes.io/targetPath 登录到存储的节点,执行df -TH,查询节点磁盘配置,并根据节点磁盘的配置进行扩容。扩容完成后,还需要完成磁盘的分区,分区操作可参考《云硬盘用户指南》扩展磁盘分区和文件系统(linux)。
弹性IP 安全组 网络ACL ELB 网络接口 存储卷 数量 3台 3个 1个 6个 7个 1个 3个 5个 1个 1个 4个 6块 表2 EC2资源规格 节点类型 数量 CPU (Cores) Mem (GiB) root盘 非root盘 备注 集群管理节点 3 8 32 100 200
gent配置。 图1 购买终端节点(指定节点IP) 单击“立即购买”,重新创建一个VPCEP。 等待1-3分钟,前往UCS控制台重新刷新集群状态。 编辑proxy-agent配置 在UCS所在区域新建一个VPCEP。 图2 购买终端节点(自动分配节点IP) 单击新创建VPCEP的ID,查看自动分配的节点IP。
host”问题,请按以下步骤进行排查: 查询VPCEP节点是否存在,是否被误删,使用以下命令获取 vpcep 终端节点 id: server=`cat config | jq '.clusters[0].cluster.server'` echo ${server:15:36} 检查上述终端节点是否存在,如果存在,检查执行机是否和
、容器文件日志、节点日志及K8s事件日志进行采集与转发。 log-agent插件的核心组件包括fluent-bit、cop-logs、log-operator和otel-collector。 fluent-bit:日志收集器,以DaemonSet形式安装在每个节点。 cop-lo
x86系统架构类型。 纳管gpu节点前,请确保节点依赖libsecurec已安装。 前提条件 在集群中纳管支持GPU虚拟化的节点,具体操作步骤请参见纳管节点。 纳管成功后,给对应支持GPU虚拟化节点打上“accelerator: nvidia-{显卡型号}”标签,具体操作步骤请参见为节点添加标签/污点。
载到容器内的,且节点引擎为docker,采集不到日志。 解决方案: 请检查工作负载所在节点的容器存储模式是否为deviceMapper,deviceMapper不支持采集容器内日志(创建日志策略时已提示此限制,如图7所示)。检查方法如下: 进入业务工作负载所在节点。 执行docker