检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
失败,Pod上会有Event告警事件FailedIPv6InsertBandwidth(如超过配额,触发流控等),请根据告警事件进行相应的处理。 弹性公网IP控制台中的“共享带宽”页面,单击共享带宽详情下的“IPv6网卡”页签,可以看到所属实例为“云容器引擎”的IPv6双栈网卡,
12m 可以看到kube-system有很多Pod,其中coredns是用于做服务发现、everest-csi是用于对接存储服务、icagent是用于对接监控系统。 这些通用的、必须的应用放在kube-system这个命名空间中,能够做到与其他Pod之间隔离,在
CCE控制台不提供针对节点的操作系统升级,也不建议您通过yum方式进行升级,如果您在节点上通过yum update升级了操作系统,会导致容器网络的组件不可用。手动恢复方式请参见如何解决yum update升级操作系统导致容器网络不可用问题?。 表1 Linux云服务器登录方式一览 是否绑定EIP 本地设备操作系统 连接方法
packageversions.version.cce.io 10.0.50.187 -o yaml | grep -A 1 canal-agent 回显如图: 解决办法 如果您希望继续使用该节点资源,建议重置所属集群中的CentOS 7.6节点,以升级节点上网络组件到最新版本,具体操作请参考重置节点。
容器无响应:如果Pod中的容器在终止过程中没有响应SIGTERM信号,则可能导致Pod卡在Terminating状态。 Pod中存在未处理完的请求或资源占用:如果Pod中存在长时间运行的进程没有结束,则可能导致Pod无法被正常终止,进入Terminating状态。 Pod存在
节点池亲和性调度(nodepoolaffinity) nodepoolaffinity.weight 节点池亲和调度,开启后默认是 10000 节点池亲和性调度 如何减少节点资源碎片,提高集群资源利用率 集群中存在大作业(request资源量较大)和小作业(request资源量较少)混合提交并运行,希望
调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 参数解释: 项目ID,获取方式请参见如何获取接口URI中参数。
o调度器。 公平调度介绍 在实际业务中,经常会遇到将集群稀缺资源分配给多个用户的情况,每个用户获得资源的权利都相同,但是需求数却可能不同,如何公平的将资源分配给每个用户是一项非常有意义的事情。调度层面有一种常用的方法为最大最小化公平分配算法(max-min fairness sh
其中{Pod IP}是GPU插件的Pod IP,返回指标结果则为正常。 在集群中安装3.9.5及以上版本的云原生监控插件,且部署模式需选择“本地数据存储”。 采集GPU指标 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“配置项与密钥”。 切换至“monitoring”命名空间
(deleteAgency) 的事件,事件对应的资源 ID 分别是已删除用户、已删除委托账号的 ID。 如果使用上述方式均无法获取到所需 ID,请提交工单联系运维人员处理。 如果您确定吊销所选用户的集群访问凭证,请在二次确认框中输入REVOKE后单击“确定”。 父主题: 连接集群
池,并且不会对节点池下已有的节点产生任何影响。 说明: 节点池升级后,如果仍通过更新节点池API扩容节点,默认创建出来的节点为按需节点。 如何轻松切换新版节点池? 您需要将集群升级到1.21.11-r0、1.23.9-r0、1.25.4-r0及以上版本,然后根据以下步骤触发新节点池升级流程。
webhook会对Pod的配置进行更新,如果集群中有其他的admission webhook,需要确保它们不会与VPA发生冲突。 VPA会处理大部分的OOM(Out Of Memory)事件,但无法保证处理所有的OOM事件。 VPA的性能尚未在大规模集群中实践。 VPA建议值可能大于实际可分配的资源量(例如节点
节点的系统盘和数据盘将会被清空,重置前请事先备份重要数据。 节点重置会清除用户单独添加的K8S标签和K8S污点,可能导致与节点有绑定关系的资源(本地存储,指定调度节点的负载等)无法正常使用。请谨慎操作,避免对运行中的业务造成影响。 升级操作完成后,节点将会自动开机。 为确保节点稳定性,系统
OOMKilled startedAt: null 本例中的容器可以自动重启,因此kubelet会再去启动它。输入多几次这个命令查看它是如何被关闭又被启动的: kubectl get pod memory-demo-2 --namespace=mem-example 这个输出显
b.com/BVLC/caffe/blob/master/examples/00-classification.ipynb的过程。 OBS存储数据预置 创建OBS桶,并确认以下文件夹已创建,文件已上传至指定位置(需要使用OBS Browser工具)。 例如:桶内文件路径/文件名,
ubectl的服务器,用于连接源集群和目标集群。该服务器需要至少拥有5GB左右的本地磁盘空间和≥8G的内存,以确保迁移工具可以正常运行,并存储相关数据,如源集群的采集数据和目标集群的推荐数据等。 迁移工具支持在Linux(x86、arm)、Windows环境中运行,因此您可以在这
放jar包,因此使用local类型。根据实际情况,该参数可采用多种类型(file/http/local等),详情请参见官方文档。 访问对象存储服务OBS 使用spark-submit下发hdfs任务。请修改命令最后的参数为租户内实际的文件obs://bucket-name/filename。
overflow! 在节点操作系统内核低于4.3时,不会显示打印,若有callbacks suppressed字样,则也有可能是ARP表超限导致。 解决办法 节点最大可允许的非永久表项数量由内核参数net.ipv4.neigh.default.gc_thresh3确定,此内核参数非names
Ingress:基于弹性负载均衡ELB(Elastic Load Balance)提供全托管、免运维的服务,支持千万级并发连接和百万级新建连接。支持对接共享型负载均衡、独享型负载均衡实例。 本文将为您介绍Nginx Ingress、ELB Ingress的差异。 典型应用场景 类型 典型应用场景 Nginx
则等指标规则执行完毕后周期规则仍会执行。 配置了“CPU分配率”和“内存分配率”的规则后,策略的检测周期会因autoscaler每次循环的处理逻辑而变动。只要一次检测出满足条件就会触发扩容(还需要满足冷却时间、节点池状态等约束条件)。 当节点数已到达集群规模上限、所属节点池的节点