检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
-nmonitoring|grep volume.kubernetes.io/targetPath 登录到存储的节点,执行df -TH,查询节点磁盘配置,并根据节点磁盘的配置进行扩容。扩容完成后,还需要完成磁盘的分区,分区操作可参考《云硬盘用户指南》扩展磁盘分区和文件系统(linux)。
导航栏“节点管理”,进入节点详情页。 单击“节点名称”下的节点,在弹出的页面中单击右上角“远程登录”,选择VNC方式登录。 根据界面提示,输入账号和密码,成功进入Linux环境中。 在云容器引擎控制台中,选择对端集群,进入集群详情页,单击左侧导航栏“节点管理”,进入节点详情页。
--------------+ 预期输出表明,该容器被分配显存总量为5000 MiB,实际使用了4792MiB。 查看所在节点的GPU显存隔离情况(在节点上执行)。 export PATH=$PATH:/usr/local/nvidia/bin;nvidia-smi 预期输出: Wed
ent配置。 图1 购买终端节点(指定节点IP) 单击“立即购买”,重新创建一个VPCEP。 等待1-3分钟,前往UCS控制台重新刷新集群状态。 编辑proxy-agent配置 在UCS所在区域新建一个VPCEP。 图2 购买终端节点(自动分配节点IP) 单击新创建VPCEP的ID,查看自动分配的节点IP。
到不同可用区的节点上,如集群下节点不满足多可用区,插件实例将调度到单可用区。 强制模式:插件Deployment实例强制调度到不同可用区的节点上,如集群下节点不满足多可用区,插件实例将无法全部运行。 配置插件实例节点亲和策略。 指定节点调度:指定插件实例部署的节点 ,若不指定,将根据集群默认调度策略进行随机调度。
es资源对象(包含节点、工作负载、任务、服务等)的只读权限。 UCS ReadOnlyAccess + CCE Administrator 本地/附着/多云/伙伴云集群 管理员权限 本地/附着/多云/伙伴云集群及集群下所有Kubernetes资源对象(包含节点、工作负载、任务、服务等)的读写权限。
本地集群 创建终端节点以私网接入本地集群 使用工作负载Identity安全访问云服务
host”问题,请按以下步骤进行排查: 查询VPCEP节点是否存在,是否被误删,使用以下命令获取 vpcep 终端节点 id: server=`cat config | jq '.clusters[0].cluster.server'` echo ${server:15:36} 检查上述终端节点是否存在,如果存在,检查执行机是否和
容器洞察 容器洞察概述 查看舰队总览 查看集群情况 查看集群内节点情况 查看集群内工作负载情况 查看集群内Pod情况 查看集群内事件情况 父主题: 容器智能分析
b,类似于Linux系统的crontab,在指定的时间周期运行指定的Job,即: 在给定时间点只运行一次。 在给定时间点周期性地运行。 CronJob的典型用法如下所示: 在给定的时间点调度Job运行。 创建周期性运行的Job,例如数据库备份、发送邮件。 创建普通任务 普通任务可
AOM服务的管理员权限,拥有该权限的用户可以操作并使用AOM CCE Administrator CCE服务的管理员权限,拥有该服务的所有权限 ELB Administrator ELB服务的管理员权限,拥有该服务的所有权限 OBS Administrator OBS服务的管理员权限,拥有该服务的所有权限
负载类型:无状态工作负载。 负载名称:负载名称可自定义。 实例数量:请根据业务需要自行选择。 描述:请输入描述信息。 时区同步:选择是否开启时区同步。开启后容器与节点使用相同时区(时区同步功能依赖容器中挂载的本地磁盘,请勿修改删除)。 在“容器配置”栏单击“选择镜像”。 在“我的镜像”页签下,选择已上传的镜像,单击“确定”。
nodeSummary NodeSummary object 节点统计信息 resourceSummary ResourceSummary object 资源统计信息 endpoints Endpoint object 端点 phase String 阶段状态信息 reason String
容器文件日志、节点日志及K8s事件日志进行采集与转发。 log-agent插件的核心组件包括fluent-bit、cop-logs、log-operator和otel-collector。 fluent-bit:日志收集器,以DaemonSet形式安装在每个节点。 cop-log
每个集群限制50条日志规则。 不采集.gz、.tar、.zip后缀类型的日志文件。 采集容器文件日志时,若节点存储模式为Device Mapper模式,路径配置必须为节点数据盘挂载路径。 若容器运行时为containerd模式,容器标准输出日志中的多行配置暂不生效。(1.3.0及以上版本没有该限制)
到容器内的,且节点引擎为docker,采集不到日志。 解决方案: 请检查工作负载所在节点的容器存储模式是否为deviceMapper,deviceMapper不支持采集容器内日志(创建日志策略时已提示此限制,如图7所示)。检查方法如下: 进入业务工作负载所在节点。 执行docker
于这个命名空间。 kube-node-lease:每个节点在该命名空间中都有一个关联的“Lease”对象,该对象由节点定期更新。NodeStatus和NodeLease都被视为来自节点的心跳,在v1.13之前的版本中,节点的心跳只有NodeStatus,NodeLease特性从v1
构。如需安装HCE OS 2.0,请提交工单,联系技术支持人员。详细了解HCE OS请参见HCE OS文档。 集群节点CPU架构暂不支持异构混部,请规划好集群的节点架构为X86或ARM64。 1.28.5及之后集群版本,支持HCE OS 2.0 ARM系统架构类型。 父主题: 安装本地集群的业务规划
修改本端集群节点的安全组,在入方向规则中允许对端集群节点访问本端集群容器端口。 如图6所示,“协议端口”填写本端集群容器端口,“源地址”填写对端集群节点IP地址或网段。修改安全组的具体操作请参见更改集群节点的默认安全组。 图6 修改安全组 验证集群间网络互通 登录本端集群节点,执行以下
纳管gpu节点前,请确保节点依赖libsecurec已安装。 前提条件 在集群中纳管支持GPU虚拟化的节点,具体操作步骤请参见纳管节点。 纳管成功后,给对应支持GPU虚拟化节点打上“accelerator: nvidia-{显卡型号}”标签,具体操作步骤请参见为节点添加标签/污点。 安装插件