检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(可选)节点上如果存在已运行的容器由第三方Pod Controller进行管理,则该节点不会被缩容。第三方Pod Controller是指除Kubernetes原生的工作负载(如Deployment、StatefulSet等)外的自定义工作负载,可通过自定义资源CRD进行创建。
CCE AI套件(NVIDIA GPU)版本发布记录 表1 CCE AI套件(NVIDIA GPU)版本记录 插件版本 支持的集群版本 更新特性 2.7.42 v1.28 v1.29 v1.30 v1.31 新增NVIDIA 535.216.03驱动,支持XGPU特性 2.7.41
修改CoreDNS配置直接解析 前提条件 CCE集群所在VPC与线下IDC已经使用专线或其他方式正确连接,IDC与VPC网段和CCE集群容器网段能够互访。专线的创建方法请参见云专线快速入门。 操作步骤 CoreDNS的配置都存储在名为coredns的ConfigMap下,您可以在
10.0.1.133 192.168.5.252 将Pod数量增加到3,可以看到Pod被调度到了另外一个节点,且这个当前这3个节点是在3个不同可用区。 $ kubectl scale --replicas=3 deploy/nginx deployment.apps/nginx
集群apiserver地址默认为内网地址,绑定弹性IP后可使用公网地址访问。 图1 获取内网或外网apiserver地址 配置集群认证信息。 获取集群的token信息(这里如果是get获取需要based64 -d解码)。 token=$(kubectl describe secret my-sa-token-secret
用于配置集群访问的文件称为kubeconfig配置文件,并不意味着文件名称为kubeconfig。 解决方案 在K8s集群的运维中,多集群之间的切换是无法避免的问题,常见的集群切换方案如下: 方案一:您可以通过指定kubectl的“--kubeconfig”参数来选择每个集群所使用的kub
token的ServiceAccount,映射到demo用户组(后续使用身份提供商ID访问云服务就具有demo用户组的权限)。此处属性必须是sub,值的格式为:system:serviceaccount:Namespace:ServiceAccountName 规则的json格式如下。
升级实例过程中实现业务不中断 应用场景 在Kubernetes集群中,应用通常采用Deployment + LoadBalancer类型Service的方式对外提供访问。应用更新或升级时,Deployment会创建新的Pod并逐步替换旧的Pod,这个过程中可能会导致服务中断。 解决方案
设置容器生命周期 操作场景 CCE提供了回调函数,在容器的生命周期的特定阶段执行调用,比如容器在停止前希望执行某项操作,就可以注册相应的钩子函数。 目前提供的生命周期回调函数如下所示: 启动命令:容器将会以该启动命令启动,请参见启动命令。 启动后处理:容器启动后触发,请参见启动后处理。
-s {container_cidr} -d {内网apiserver的IP} -j REJECT 其中,{container_cidr}是集群的容器网络,如10.0.0.0/16。 为保证配置持久化,建议将该命令写入/etc/rc.local 启动脚本中。 CCE Turbo集
delete:表示删除PVC,PV及其关联的子目录均会被删除。 说明: 删除子目录时,仅删除PVC参数中设置的子目录绝对路径,不会级联删除上层目录。 storage 是 PVC申请容量,单位为Gi。 对SFS Turbo子目录类型的PVC来说,此处仅为校验需要(不能为空和0),设置的大小不起作用,此处可以设定为固定值10Gi。
优雅终止(SIGTERM) 表示容器在主机指示后正确关闭。一般来说,退出码143不需要进行故障排除。 255 状态码超出范围 表示容器退出状态码超出范围。例如,可能是设置异常退出使用exit(-1)导致的,而-1将会自动转换成255。 出现该异常时无法判断原因,需要进一步通过容器日志定位原因。 Linux标准中断信号
kubectl配置有误,请重新对接kubectl,具体请参见使用kubectl连接集群。 对接云存储后,存储未创建成功。 出现上述问题可能是创建的pvc中annotation字段导致的,请修改模板名称后再次进行安装。 如果kubectl没有配置好,helm install时会出现如下报错:
密钥名称由两部分组成:KeyPair-4位随机数字,使用一个容易记住的名称,如KeyPair-xxxx_ecs。 您的浏览器会提示您下载或自动下载私钥文件。文件名是您为密钥对指定的名称,文件扩展名为“.pem”。请将私钥文件保存在安全位置。然后在系统弹出的提示框中单击“确定”。 这是您保存私钥文件的唯一
场景示例:核对资源用量是否与实际相符 假设用户在2023/04/08 10:09:06购买了一个按需计费的集群(集群规模:50节点,高可用:是),并在2023/04/08 12:09:06时刻将其删除。 云容器引擎流水账单 按需计费集群按秒计费,每一个小时整点结算一次费用,您可以在
TFJob可在GPU场景下进行,该场景需要集群中包含GPU节点,并安装合适的驱动。 在TFJob中指定GPU资源。 创建tf-gpu.yaml文件,示例如下: 该示例的主要功能是基于Tensorflow的分布式架构,利用卷积神经网络(CNN)中的ResNet50模型对随机生成的图像进行训练,每次训练32张图像(bat
跨区域使用OBS桶 默认情况下,Pod仅支持使用同一个区域(Region)的OBS桶。CCE支持工作负载使用其他区域的OBS桶,在某些场景下有利于提升OBS桶的资源利用率,但跨区域使用OBS相比同区域访问时延波动要更大。 约束与限制 CCE容器存储(Everest)版本要求1.2
预置条件 本实践提供在CCE上运行caffe的基础分类例子https://github.com/BVLC/caffe/blob/master/examples/00-classification.ipynb的过程。 OBS存储数据预置 创建OBS桶,并确认以下文件夹已创建,文件已上传至指定位置(需要使用OBS
CCE集群IPVS转发模式下conn_reuse_mode问题说明 问题说明 对于节点内核版本小于5.9的场景,CCE集群在IPVS模式下,通过Service方式访问集群内部服务,偶现1秒延时或者后端业务升级后访问Service失败的情况,引起该问题的主要原因为社区IPVS连接复用Bug。
节点预留资源策略说明 节点的部分资源需要运行一些必要的Kubernetes系统组件和Kubernetes系统资源,使该节点可作为您的集群的一部分。 因此,您的节点资源总量与节点在Kubernetes中的可分配资源之间会存在差异。节点的规格越大,在节点上部署的容器可能会越多,所以K