检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一个可用GPU节点,节点上的GPU卡数量大于等于2。 由于安装Kubeflow需要从github下载文件,从gcr.io等下载镜像,建议在华为云国际站创建集群,否则容易碰到较多网络问题。 节点上绑定了EIP,并配置了kubectl命令行工具,详情请参见通过kubectl连接集群。
节点池亲和性调度(nodepoolaffinity) nodepoolaffinity.weight 节点池亲和调度,开启后默认是 10000 节点池亲和性调度 如何减少节点资源碎片,提高集群资源利用率 集群中存在大作业(request资源量较大)和小作业(request资源量较少)混合提交并运行,希望
能,较为常见的解决方案有IP VLAN等。 图2 不同节点上的Pod通信 以上就是容器网络底层视图,后面将进一步介绍Kubernetes是如何在此基础上向用户提供访问方案,具体请参见Service和Ingress。 父主题: Kubernetes网络
o调度器。 公平调度介绍 在实际业务中,经常会遇到将集群稀缺资源分配给多个用户的情况,每个用户获得资源的权利都相同,但是需求数却可能不同,如何公平的将资源分配给每个用户是一项非常有意义的事情。调度层面有一种常用的方法为最大最小化公平分配算法(max-min fairness sh
接集群。 创建名为“ingress-test.yaml”的YAML文件,此处文件名可自定义。 vi ingress-test.yaml 以关联已有ELB为例,YAML文件配置如下: apiVersion: networking.k8s.io/v1 kind: Ingress metadata:
指标规则阈值的单位,当前仅支持“%” spec.targetNodepoolIds Array 伸缩策略关联的所有节点池 spec.targetNodepoolIds[x] String 伸缩策略关联节点池的uid 父主题: 节点弹性伸缩
drain 192.168.1.xx --ignore-daemonsets=true --delete-emptydir-data 参数详情请参见如何驱逐节点上的所有Pod。 预期效果: node/192.168.1.xx drained 如果有DaemonSet工作负载使用了GPU卡,
是 String 参数解释: 项目ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 账号的项目ID 默认取值: 不涉及 cluster_id 是 String 参数解释: 集群ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围:
是 String 参数解释: 项目ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 账号的项目ID 默认取值: 不涉及 cluster_id 是 String 参数解释: 集群ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围:
池,并且不会对节点池下已有的节点产生任何影响。 说明: 节点池升级后,如果仍通过更新节点池API扩容节点,默认创建出来的节点为按需节点。 如何轻松切换新版节点池? 您需要将集群升级到1.21.11-r0、1.23.9-r0、1.25.4-r0及以上版本,然后根据以下步骤触发新节点池升级流程。
Docker几乎支持在所有操作系统上安装,用户可以根据需要选择要安装的Docker版本。 以“CentOS 7.5 64bit(40GiB)”操作系统为例,使用华为云镜像快速安装Docker。 添加yum源。 # yum install epel-release -y # yum clean all 安装yum-util。
接集群。 创建名为“ingress-test.yaml”的YAML文件,此处文件名可自定义。 vi ingress-test.yaml 以关联已有ELB为例,YAML文件配置如下: apiVersion: networking.k8s.io/v1 kind: Ingress metadata:
28.4-r0及以上版本的集群支持。 图1 配置服务器名称指示(SNI) 单击“确定”,创建Service。 通过kubectl命令行创建 以关联已有ELB为例,Service使用SNI的YAML文件配置如下: apiVersion: v1 kind: Service metadata:
metric api提供给HPA controller使用,这样HPA controller就能根据监控数据进行弹性伸缩。 本示例中需要监控工作负载相关联的ELB指标,因此目标工作负载需要使用负载均衡类型的Service或Ingress。 查看需要监控的工作负载访问方式,获取ELB监听器ID。
OOMKilled startedAt: null 本例中的容器可以自动重启,因此kubelet会再去启动它。输入多几次这个命令查看它是如何被关闭又被启动的: kubectl get pod memory-demo-2 --namespace=mem-example 这个输出显
er)后,原有功能保持不变,但请注意不要新建Flexvolume插件(storage-driver)的存储,否则将导致部分存储功能异常。 如何判断集群的存储插件模式 登录CCE控制台。 在控制台左侧栏目树中,单击“插件中心”。 在右侧的插件管理列表中,单击“插件实例”页签。 在插
升级修复。 如果您是自行选择安装的NVIDIA GPU驱动或更新过节点上的GPU驱动,请参考上图确认您安装的GPU驱动是否受该漏洞影响。 如何确认GPU节点的NVIDIA驱动版本 登录到您的GPU节点,执行如下命令,即可查看驱动版本。 [root@XXX36 bin]# ./nvidia-smi
ConfigMap、Secret:特殊类型,将Kubernetes特定的对象类型挂载到Pod,在ConfigMap和Secret章节介绍过如何将ConfigMap和Secret挂载到Volume中。 persistentVolumeClaim:Kubernetes的持久化存储类型
上角“创建网络策略”。 策略名称:自定义输入NetworkPolicy名称。 命名空间:选择网络策略所在命名空间。 选择器:输入标签选择要关联的Pod,然后单击添加。您也可以单击“引用负载标签”直接引用已有负载的标签。 入方向规则:单击添加入方向规则,参数设置请参见表1。 表1 添加入方向规则
71s StatefulSet的网络标识 StatefulSet创建后,可以看下Pod是有固定名称的,那Headless Service是如何起作用的呢,那就是使用DNS,为Pod提供固定的域名,这样Pod间就可以使用域名访问,即便Pod被重新创建而导致Pod的IP地址发生变化,这个域名也不会发生变化。