检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
停止服务(docker运行时) systemctl stop kubelet kubelet-monit docker docker-monit 检查是否有程序正在使用GPU卡设备。 运行命令: sudo fuser -v /dev/nvidia* 如无fuser命令(以基于RPM的Linux发行版为例),可执行命令yum
创建StatefulSet的Yaml文件。 vi statefulset.yaml 向statefulset.yaml文件中填入以下内容,该内容仅是标准StatefulSet应用配置的模板,您可以根据需求自行定义。 apiVersion: apps/v1 kind: StatefulSet
以下代码,验证是否能从Pod访问ECS。其中,10.1.1.24为被访问ECS的IP地址。 ping 10.1.1.24 如果访问不通,请检查ECS安全组“入方向规则”中是否包含集群节点子网。若没有请添加相关规则,您需要添加相应的安全组规则,具体请参见添加安全组规则。 Pod有p
19版本集群 支持SFS、SFS Turbo类型存储 支持CronJob 支持配置envFrom 日志文件自动转储 屏蔽TCPSocket类型健康检查 支持配置资源标签(pod-tag) 提升了性能和可靠性 修复了一些已知问题 1.0.5 v1.13 v1.15 v1.17 支持v1.17版本集群
支持配置插件资源规格 1.2.3 v1.15 v1.17 v1.19 适配ARM64节点部署 1.2.2 v1.15 v1.17 v1.19 增强健康检查能力 1.2.1 v1.15 v1.17 v1.19 适配CCE v1.19集群 更新插件为稳定版本 1.1.3 v1.15 v1.17 支持周期扩缩容规则
Turbo集群可以使用普通运行时或安全运行时。具体区别请参见安全运行时与普通运行时。 容器配置 容器信息 Pod中可以配置多个容器,您可以单击右侧“添加容器”为Pod配置多个容器。 基本信息:配置容器的基本信息。 参数 说明 容器名称 为容器命名。 更新策略 镜像更新/拉取策略。可以勾选“总是拉
子维度 CCE Turbo集群 CCE Standard集群 集群 定位 面向云原生2.0的新一代容器集群产品,计算、网络、调度全面加速 标准版本集群,提供商用级的容器集群服务 节点形态 支持虚拟机和裸金属服务器混合 支持虚拟机和裸金属服务器混合 网络 网络模型 云原生网络2.0:面向大规模和高性能的场景。
系统选择与最终业务容器镜像相同或接近的Linux发行版本。 安全加固 等保加固会对身份鉴别、访问控制、安全审计、入侵防范、恶意代码防范进行检查并加固。详情请参见Huawei Cloud EulerOS 2.0等保2.0三级版镜像概述。 节点名称 节点云服务器使用的名称,批量创建时将作为云服务器名称的前缀。
系统选择与最终业务容器镜像相同或接近的Linux发行版本。 安全加固 等保加固会对身份鉴别、访问控制、安全审计、入侵防范、恶意代码防范进行检查并加固。详情请参见Huawei Cloud EulerOS 2.0等保2.0三级版镜像概述。 登录方式 密码 用户名默认为“root”,请输入登录节点的密码,并确认密码。
常调度:建议为插件配置合理的资源。 kruise-controller-manager配置了调度或亲和策略导致该Pod无法被正常调度:建议检查调度策略并配置合适的调度策略,以确保kruise-controller-manager被正常调度。 版本记录 表3 OpenKruise插件版本记录
而提升“ps”和“worker”之间进行网络和数据交互的效率,进而提升计算效率。然而Kubernetes默认调度器在调度Pod过程中,仅会检查Pod与现有集群下所有已经处于运行状态Pod的亲和性和反亲和性配置是否冲突或吻合,并不会考虑接下来可能会调度的Pod造成的影响。 Volc
之间的关系如下图所示。 图1 PVC绑定PV CSI CSI(Container Storage Interface,容器存储接口)是容器标准存储接口规范,也是Kubernetes社区推荐的存储插件实现方案。CCE容器存储(Everest)是CCE基于CSI开发的自研存储插件,能够为容器提供不同类型的持久化存储功能。
修复进程级故障恢复和给工作负载添加注解偶现失败问题 2.0.5 v1.21 v1.23 v1.25 v1.27 v1.28 适配CCE v1.28集群 支持存活探针检查机制 支持为业务容器自动挂载Ascend驱动 1.2.14 v1.19 v1.21 v1.23 v1.25 v1.27 支持NPU监控 1
待采集完成后,进入工作负载详情页,单击右上角的“日志”按钮查看日志详情。 您还可以在AOM控制台查看日志。 另外您还可以使用kubectl logs命令查看容器的标准输出,具体如下所示。 # 查看指定pod的日志 kubectl logs <pod_name> kubectl logs -f <pod_name>
进程调用listen系统监听端口时会传入一个backlog参数,该参数决定socket连接队列大小,且其值不大于somaxconn取值。Go程序标准库在listen时,默认直接读取somaxconn作为队列大小,但Nginx监听socket时并不会读取somaxconn,而是读取nginx
pentelemetry构建的云原生日志采集插件。云原生日志采集插件支持基于CRD的日志采集策略,可以根据您配置的策略规则,对集群中的容器标准输出日志、容器文件日志、节点日志及K8s事件日志进行采集与转发。 CCE节点故障检测 CCE节点故障检测插件(node-problem-d
Cluster Autoscaler工作原理 Cluster Autoscaler主要流程包括两部分: 扩容流程: Autoscaler会每隔10s检查一次所有未调度的Pod,根据用户设置的策略,选择出一个符合要求的节点池进行扩容。 Autoscaler检测未调度Pod进行扩容时,使用的是
Controller获取真实的客户端IP: 使用WAF云模式的CNAME接入 采用CNAME模式接入,会导致请求先通过WAF,经过WAF进行防护检查之后再转发给ELB。因此即使ELB已开启源地址透传,实际上客户端得到为WAF的回源IP,造成Nginx Ingress Controlle
Error:错误,表示节点处于故障状态。 lastProbeTime String 节点最近一次状态检查时间。集群处于异常、冻结或者中间态(例如创建中)时,节点的状态检查动作可能受影响。检查时间超过5分的节点状态不具有参考意义。 jobID String 创建或删除时的任务ID。 serverId
Error:错误,表示节点处于故障状态。 lastProbeTime String 节点最近一次状态检查时间。集群处于异常、冻结或者中间态(例如创建中)时,节点的状态检查动作可能受影响。检查时间超过5分的节点状态不具有参考意义。 jobID String 创建或删除时的任务ID。 serverId