-
CCE部署使用Flink - 云容器引擎 CCE
CCE部署使用Flink 本实践提供在华为云CCE集群中部署flink集群,并执行WordCount任务的流程说明。 预置条件 已创建CCE集群,且集群下有可用节点,集群内节点已绑定弹性IP,且配置了kubectl命令行工具。 部署流程 主要参照https://ci.apache
-
容器如何访问VPC内部网络 - 云容器引擎 CCE
容器如何访问VPC内部网络 前面章节介绍了使用Service和Ingress访问容器,本节将介绍如何从容器访问内部网络(VPC内集群外),包括VPC内访问和跨VPC访问。 VPC内访问 根据集群容器网络模型不同,从容器访问内部网络有不同表现。 容器隧道网络 容器隧道网络在节点网络
-
CCE集群中的节点无法远程登录,如何排查解决? - 云容器引擎 CCE
于linux。 解决方法 使用linux用户登录,使用sudo su命令切换到root用户。 父主题: 节点运行
-
挂载第三方租户的对象存储 - 云容器引擎 CCE
挂载第三方租户的对象存储 本章节介绍如何挂载第三方租户的OBS桶,包含OBS并行文件系统(优先)和OBS对象桶。 使用场景 SaaS服务提供商的CCE集群需要挂载使用第三方租户的OBS桶,使用场景如图1所示。 图1 挂载第三方租户的对象存储使用场景 第三方租户授权SaaS服务提供
-
如何避免非GPU/NPU负载调度到GPU/NPU节点? - 云容器引擎 CCE
如何避免非GPU/NPU负载调度到GPU/NPU节点? 问题现象 当集群中存在GPU/NPU节点和普通节点混合使用的场景时,普通工作负载也可以调度到GPU/NPU节点上,可能出现GPU/NPU资源未充分利用的情况。 问题原因 由于GPU/NPU节点同样提供CPU、内存资源,在一般
-
如何设置容器umask值? - 云容器引擎 CCE
如何设置容器umask值? 问题描述 tailf /dev/null的方式启动容器,然后手动执行启动脚本的方式得到的目录的权限是700,而不加tailf由Kubernetes自行启动的方式得到的目录权限却是751。 解决方案 这个问题是因为两种方式设置的umask值不一样,所以创建出来的目录权限不相同。
-
CCE如何与其他服务进行内网通信? - 云容器引擎 CCE
CCE如何与其他服务进行内网通信? 与CCE进行内网通信的华为云常见服务有:RDS、DMS、Kafka、RabbitMQ、VPN、ModelArts等,有如下两种场景: 在同一个VPC网络下,CCE节点可以与此VPC下的所有服务进行互通。CCE的容器与其他服务通信时,需要关注对端
-
如何避免节点上的某个容器被驱逐? - 云容器引擎 CCE
如何避免节点上的某个容器被驱逐? 问题背景 在工作负载调度时可能会发生一个节点上的两个容器之间互相争资源的情况,最终导致kubelet将其全部驱逐。那么能不能设定策略让其中一个服务一直保留?如何设定? 问题建议 Kubelet会按照下面的标准对Pod的驱逐行为进行评判: 根据服务
-
区域与可用区 - 云容器引擎 CCE
图1阐明了区域和可用区之间的关系: 图1 区域和可用区 目前,全球多个地域均已开放云服务,您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。 如何选择区域? 选择区域时,您需要考虑以下因素: 地理位置 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。
-
如何让多个Pod均匀部署到各个节点上? - 云容器引擎 CCE
如何让多个Pod均匀部署到各个节点上? Kubernetes中kube-scheduler组件负责Pod的调度,对每一个新创建的 Pod 或者是未被调度的 Pod,kube-scheduler 会选择一个最优的节点去运行这个 Pod。kube-scheduler 给一个 Pod
-
服务加入Istio后,如何获取客户端真实源IP? - 云容器引擎 CCE
服务加入Istio后,如何获取客户端真实源IP? 问题现象 服务启用Istio后,访问日志中无法获取到客户端源IP。 解决方案 本文以绑定ELB类型Service的nginx应用为例,详细步骤如下: ELB侧开启获取客户端IP 独享型ELB默认开启源地址透传功能,无需手动开启。 登录弹性负载均衡ELB的管理控制台。
-
如何修复出现故障的容器网卡? - 云容器引擎 CCE
如何修复出现故障的容器网卡? 容器的网卡出现故障,会导致容器不断重启,且该容器无法对外提供服务。可通过如下步骤修复出现故障的容器网卡: 操作步骤 执行如下命令,删除故障容器的Pod。 kubectl delete pod {podName} -n {podNamespace} 其中:
-
冻结或不可用的集群删除后如何清除残留资源 - 云容器引擎 CCE
冻结或不可用的集群删除后如何清除残留资源 处于非运行状态(例如冻结、不可用状态)中的集群,由于无法获取集群中的PVC、Service、Ingress等资源,因此删除集群之后可能会残留网络及存储等资源,您需要前往资源所属服务手动删除。 弹性负载均衡资源 前往弹性负载均衡控制台。 通过集群使用的VPC
-
插件安装失败,提示The release name is already exist如何解决? - 云容器引擎 CCE
插件安装失败,提示The release name is already exist如何解决? 问题现象 当安装插件失败,返回 The release name is already exist 错误。 问题原因 当安装插件返回The release name is already
-
CCE集群升级时,升级集群插件失败如何排查解决? - 云容器引擎 CCE
CCE集群升级时,升级集群插件失败如何排查解决? 概述 本文主要介绍在CCE在升级集群时,如何查找插件升级失败的原因,并解决问题。 操作步骤 插件升级失败后,请优先进行重试。若重试不成功,则根据后续步骤排查问题。 在升级界面显示失败后,请退出集群升级页面,前往“插件中心”界面查看
-
CCE集群的计费方式如何由按需改为包年包月? - 云容器引擎 CCE
CCE集群的计费方式如何由按需改为包年包月? 当前在CCE中购买集群时支持“按需计费”和“包年/包月”(按周期)两种计费方式。按需计费的购买的集群可以转成按周期计费的集群。 约束与限制 仅支持默认节点池DefaultPool内节点转成按包周期计费,其他创建的节点池中节点不支持转包周期。
-
CCE节点事件中一直出现“镜像回收失败”告警如何解决? - 云容器引擎 CCE
告警中提到的容器ID。 节点使用docker运行时: docker ps -a | grep {containerId} 节点使用containerd运行时: crictl ps -a | grep {containerId} 如果您确认容器已不再使用,请执行以下命令,彻底清除处
-
Ingress中的property字段如何实现与社区client-go兼容? - 云容器引擎 CCE
Ingress中的property字段如何实现与社区client-go兼容? 使用场景 社区Ingress结构体中没有property属性,导致用户使用client-go调用创建ingress的api接口时,创建的Ingress中没有property属性。为了与社区的client-go兼容,CCE提供了如下解决方案。
-
资源准备 - 云容器引擎 CCE
待GPU节点创建完成后,可前往“节点列表”查看节点状态。 导入OBS存储卷 进入存储管理页面,导入OBS存储数据预置中创建的OBS存储卷。 父主题: CCE部署使用Caffe
-
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE
io”。 fsType 文件类型,支持“obsfs”与“s3fs”,取值为s3fs时创建是obs对象桶,配套使用s3fs挂载;取值为obsfs时创建的是obs并行文件系统,配套使用obsfs挂载。可参考FlexVolume PV的spec.flexVolume.options.pos