检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
这些节点上有污点(Taints)存在。比如,对于一个与节点本地状态有着深度绑定的应用而言, 您可能希望在出现网络分裂事件时仍然停留在当前节点上运行一段较长的时间,以等待网络恢复以避免被驱逐。 某些情况下,Kubernetes节点控制器会自动给节点添加一个污点,建议给node.kubernetes
如果在删除集群时选择同步删除节点,将会同步删除节点挂载的系统盘和数据盘,请提前做好数据备份。 在集群非运行状态(例如冻结、不可用状态)时删除集群,会残留存储、网络等关联资源,请妥善处理。 删除按需计费的集群 处于休眠状态的集群无法直接删除,请将集群唤醒后重试。 登录CCE控制台,在左侧导航栏中选择“集群管理”。
使用说明:仅支持协议为HTTP/HTTPS的监听器。 配置建议: 取值:1-300s,默认为60s 仅支持协议为HTTP/HTTPS的监听器 是否开启HTTP/2 客户端与LB之间的HTTPS请求的HTTP2功能的开启状态。 开启后,可提升客户端与LB间的访问性能,但LB与后端服务器间仍采用HTTP1.X协议 参数名
mount {sfsturbo共享地址} to xxx failed PV中共享地址不正确。 Pod所在节点与需挂载的SFS Turbo文件系统间的网络不通。 检查PV中共享地址是否正确。 获取PV的YAML,查看spec.csi.volumeAttributes下的everest.io/
replicas定义了Pod的数量,即这个Deployment控制2个Pod;spec.selector是Label Selector(标签选择器),表示这个Deployment会选择Label为app=nginx的Pod;spec.template是Pod的定义,内容与Pod中的定义完全一致。
使用curl命令检查数据,其中10.1.1.15为上一步查询的Pod IP: curl 10.1.1.15:9400/metrics | head 相关链接 GPU监控指标说明 父主题: GPU调度
参数类型 描述 uid String 唯一id标识 name String 资源名称 labels Map<String,String> 资源标签,key/value对格式,接口保留字段,填写不会生效 annotations Map<String,String> 资源注解,由key/value组成
secret的名称 namespace secret的命名空间 secret.kubernetes.io/used-by: csi 带上这个标签才能在控制台上创建OBS PV/PVC时可见。 type 密钥类型,该值必须为cfe/secure-opaque 使用该类型,用户输入的数据会自动加密。
实例弹性到CCI服务的方法请参见CCE容器实例弹性伸缩到CCI服务。 两个维度的弹性组件与能力可以分开使用,也可以结合在一起使用,并且两者之间可以通过调度层面的容量状态进行解耦,详情请参见使用HPA+CA实现工作负载和节点联动弹性伸缩。 组件介绍 工作负载弹性伸缩类型介绍 表1 工作负载弹性伸缩类型
https://github.com/BVLC/caffe/blob/master/examples/00-classification.ipynb 另存链接中里面小猫图片。 data/ilsvrc12/* https://github.com/BVLC/caffe/tree/master/data/ilsvrc12
共享创建完成后,RAM会向指定的使用者发送共享邀请,账号B需接受共享邀请后,才可以访问和使用被共享的资源。 (账号B操作)登录CCE控制台,创建一个CCE Turbo集群。 在网络配置中,请选择由账号A共享的VPC。其余配置可参考购买CCE集群。 图1 选择共享VPC 父主题: 集群
使用Init容器初始化应用 CCE中使用x86和ARM双架构镜像 使用SWR触发器自动更新工作负载版本 插件高可用部署 应用容器化改造 工作负载参数配置实践 容器网络带宽限制的配置建议 使用hostAliases参数配置Pod的/etc/hosts文件 容器与节点时区同步 在CCE Turbo集群中配置Pod延时启动参数
5%,即升级过程中可能的最大Pod数为13。在该工作负载注解中,指定了Pod延时启动时间为20s,在该时间内保证Pod正常启动后,跨VPC网络可正常访问。 表1 Pod延迟启动annotation配置 注解 默认值 参数说明 取值范围 cni.yangtse.io/readiness-delay-seconds
log v1.19及以下版本集群:/var/paas/sys/log/kubernetes/kube-proxy.log yangtse日志(网络) v1.21及以上版本集群:/var/log/cce/yangtse v1.19及以下版本集群:/var/paas/sys/log/yangtse
od重建,访问将恢复。 问题场景三:部分老版本的CCE插件存在该异常 请将老版本的CCE插件升级至最新版本。例如1.2.2以下的CCE容器网络扩展指标插件存在该问题,需升级至1.2.2及以上版本。 问题场景四:日志分析里面出现“failed to execute docker ps
需要对业务做部分解耦拆分。 方式三: 整体微服务架构改造,再容器化 单独扩展:拆分为微服务后,可单独增加或缩减每个微服务的实例数量。 提升开发速度:各微服务之间解耦,某个微服务的代码开发不影响其他微服务。 通过隔离确保安全:整体应用中,若存在安全漏洞,会获得所有功能的权限。微服务架构中,若攻击了某
机调度。 指定节点池调度:指定插件实例部署的节点池。若不指定,将根据集群默认调度策略进行随机调度。 自定义亲和策略:填写期望插件部署的节点标签实现更灵活的调度策略,若不填写将根据集群默认调度策略进行随机调度。 同时设置多条自定义亲和策略时,需要保证集群中存在同时满足所有亲和策略的节点,否则插件实例将无法运行。
2024/05/23 13 runc systemd属性注入漏洞公告(CVE-2024-3154) 漏洞公告 2024/04/29 14 集群网络、存储功能可靠性加固说明 产品变更公告 2024/04/26 15 1.23版本集群停止维护公告 集群版本公告 2024/04/25 16
逐阈值时,允许Pod优雅终止的时间,即软驱逐宽限期,软驱逐信号与驱逐处理之间的时间差。默认为90秒。 eviction-max-pod-grace-period:最大驱逐pod宽限期,停止信号与kill之间的时间差。 硬驱逐条件:硬驱逐机制则简单得多,一旦达到阈值,直接把Pod从本地驱逐。
记录工作负载数目,便于迁移后检查。 存储 确认应用中存储,是否使用云,或者自己搭建存储。 自动创建的存储需要在新集群中变成使用已有存储。 网络 注意使用的负载均衡服务,以及Ingress。 老版本的集群只支持经典型负载均衡服务,迁移到新集群中需要改成共享型负载均衡服务,对应负载均衡服务将会重新建立。