检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
release name is already exist如何解决? 问题现象 当安装插件失败,返回 The release name is already exist 错误。 问题原因 当安装插件返回The release name is already exist错误时,表示kuber
已在CCE创建一个集群clusterA,集群下有一个可用GPU节点,节点上的GPU卡数量大于等于2。 由于安装Kubeflow需要从github下载文件,从gcr.io等下载镜像,建议在华为云国际站创建集群,否则容易碰到较多网络问题。 节点上绑定了EIP,并配置了kubectl命令行工具,详情请参见通过kubectl连接集群。
其中<HTTP URL>为上一步中的HTTP URL地址, <Token>为上一步中获取的密码。其余URL查询参数如下: query:Prometheus表达式查询字符串。 time:设置查询监控数据的时间戳。 timeout:设置超时时间,单位为毫秒。 拼接后参考命令如下: curl -H
#已创建的PVC名称 执行以下命令,创建一个挂载对象存储的应用。 kubectl apply -f web-demo.yaml 工作负载创建成功后,您可以尝试验证数据持久化及共享性。 验证数据持久化及共享性 查看部署的应用及文件。 执行以下命令,查看已创建的Pod。 kubectl
SK_OF_YOUR_ACCOUNT / OBS_ENDPOINT为实际值。 AK_OF_YOUR_ACCOUNT:上一步中获取的AK。 SK_OF_YOUR_ACCOUNT:上一步中获取的SK。 OBS_ENDPOINT:OBS的Endpoint,可前往地区和终端节点查询。 cp ~/s
首先开发者在开发环境机器上开发应用并制作镜像。 Docker执行命令,构建镜像并存储在机器上。 开发者发送上传镜像命令。 Docker收到命令后,将本地镜像上传到镜像仓库。 开发者向生产环境机器发送运行镜像命令。 生产环境机器收到命令后,Docker会从镜像仓库拉取镜像到机器上,然后基于镜像运行容器。
能访问宿主机的敏感数据,甚至利用宿主机作为跳板,进一步控制整个集群或租户账户。以下是一些建议,以降低这种风险。 容器镜像最小化 为了加强容器镜像的安全性,首先应从镜像中移除所有不必要的二进制文件。如果使用的是Docker Hub上的未知镜像,推荐使用如Dive这样的工具来审查镜像
d不会使用任何计算或内存资源。 图1 提交机制的工作原理 在CCE上运行SparkPi例子 在执行Spark的机器上安装kubectl,详情请参见通过kubectl连接集群。 kubectl安装成功后,执行如下命令授予集群权限。 # 创建服务账号 kubectl create serviceaccount
由于集群A为kubectl的默认连接集群,使用kubectl命令时无需添加“--kubeconfig”参数。而在使用kubectl连接集群B时,需要添加“--kubeconfig”参数用于指定kubectl命令所使用的凭证。例如查看集群B的节点命令如下: kubectl --kubeconfig=$HOME/
配置项导入:选择一个配置项,将配置项中所有键值都导入为环境变量。 在“容器配置”中找到“生命周期”,在右侧选择“启动后处理”页签,并填写以下参数。 处理方式:命令行脚本。 执行命令:以下命令需分三行填写,其中SPECIAL_LEVEL和SPECIAL_TYPE为工作负载中的环境变量名,即cce-configmap配置项中的键名。
以下操作手动完成容器镜像的迁移。 远程登录原集群中任意一个节点,使用docker pull命令拉取所有镜像到本地。 登录SWR控制台,单击页面右上角的“登录指令”并复制。 在节点上执行上一步复制的登录指令。 登录成功会显示“Login Succeeded”。 为所有本地镜像打上标签。
脚本返回0,否则返回-1。 对于HTTP请求探测,可以使用脚本命令来对容器尝试使用wget命令进行探测。 wget http://127.0.0.1:80/health-check 并检查response 的返回码,如果返回码在200~399 的范围,脚本返回0,否则返回-1。如下图:
升级示例 Deployment的升级可以是声明式的,也就是说只需要修改Deployment的YAML定义即可,比如使用kubectl edit命令将上面Deployment中的镜像修改为nginx:alpine。修改完成后再查询ReplicaSet和Pod,发现创建了一个新的ReplicaSet,Pod也重新创建了。
务。 步骤三:在集群中创建节点池和节点 您需在集群中创建节点,即可在节点上运行您的容器化应用。 步骤四:使用kubectl命令行工具连接集群 在使用Helm模板前,您需要在一台虚拟机上使用kubectl命令行工具连接刚刚创建的集群。 步骤五:安装Helm 在安装kubectl工具
如果直接使用reboot命令,可能会导致节点在上报状态之前就被重启,从而造成节点无法在30min内到达运行中状态,触发超时回滚。因此请尽量避免使用reboot指令。 如果确实需要重启节点,可以选择: 在安装后脚本中使用shutdown -r <时间>命令,延迟重启。例如,使用shutdown
如果直接使用reboot命令,可能会导致节点在上报状态之前就被重启,从而造成节点无法在30min内到达运行中状态,触发超时回滚。因此请尽量避免使用reboot指令。 如果确实需要重启节点,可以选择: 在安装后脚本中使用shutdown -r <时间>命令,延迟重启。例如,使用shutdown
的节点上,详情请参见PodNodeSelector。 登录CCE控制台,单击集群名称进入集群,在左侧选择“命名空间”。 找到目标命名空间,单击“节点亲和”列的。 在弹出的窗口中,选择“启用”并单击“确定”。 启用后,命名空间下新创建的工作负载只能调度到拥有特定标签的节点上。例如,
16.3.10:80,172.16.3.6:80 5h49m 下面进一步了解这又是如何实现的。 在Kubernetes集群架构中介绍过Node节点上的kube-proxy,实际上Service相关的事情都由节点上的kube-proxy处理。在Service创建时Kubernete
get -n 2500000 -q 请将上述脚本中的<node_ip>替换成集群中节点的实际IP,另外32293端口则为上一步服务详情中查询到的节点端口。 通过以下命令,可以查询节点当前的超卖资源量并持续观察其变化。 kubectl describe node 192.168.98.230
fication.ipynb。 使用CPU 创建一个普通job,镜像输入第三方镜像bvlc/caffe:cpu,设置对应的容器规格。 启动命令添加python /home/caffeEx00.py。 挂载刚刚导入的OBS存储盘: 单击“创建”。等待job执行完成,进入OBS存储盘