检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
时,指定代理根证书签发的客户端证书对应的私钥 参数名 取值范围 默认值 是否允许修改 作用范围 Authentication.authenticatingProxy.privateKey Base64编码 无 允许 CCE Standard/CCE Turbo 父主题: 集群
在TFJob中指定GPU资源。 创建tf-gpu.yaml文件,示例如下: 该示例的主要功能是基于Tensorflow的分布式架构,利用卷积神经网络(CNN)中的ResNet50模型对随机生成的图像进行训练,每次训练32张图像(batch_size),共训练100次(step)
您已经创建好一个文件存储,并且文件存储与集群在同一个VPC内。 使用通用文件系统(SFS 3.0)时,您需要提前在集群所在VPC创建一个VPC终端节点,集群需要通过VPC终端节点访问通用文件系统。配置VPC终端节点的方法请参见配置VPC终端节点。 约束与限制 支持多个PV挂载同一个SFS或SFS
默认值:default-scheduler disable_mount_path_v1 否 Bool 默认值:false true:不将/opt/cloud/cce/nvidia挂载到GPU容器的/usr/lib/nvidia路径上 disable_nvidia_gsp 否 Bool 默认值:true
默认为:250m limitsMem 是 String 内存大小限制,单位:Mi 默认为:512Mi name 是 String 插件名称,固定为:virtual-kubelet requestsCpu 是 String 申请的CPU大小,单位:m 默认为:250m requestsMem 是 String
您可以按需对特定的系统采集任务的采集周期进行个性化配置。 建议您保持kubelet、kubelet-cadvisor、kube-state-metrics、virtual-kubelet-pods四个采集任务的采集周期一致。 采集任务启停 您可以按需开启或关闭系统采集任务。 ServiceMonitor采集配置
这些节点上有污点(Taints)存在。比如,对于一个与节点本地状态有着深度绑定的应用而言, 您可能希望在出现网络分裂事件时仍然停留在当前节点上运行一段较长的时间,以等待网络恢复以避免被驱逐。 某些情况下,Kubernetes节点控制器会自动给节点添加一个污点,建议给node.kubernetes
PU管理策略。 33 用户节点组件健康检查异常处理 检查用户节点的容器运行时组件和网络组件等是否健康。 34 控制节点组件健康检查异常处理 检查集群中的Kubernetes组件、容器运行时组件、网络组件等组件,要求在升级前以上组件运行正常。 35 K8s组件内存资源限制检查异常处理
U Burst、出口网络QoS分级控制等。 为了兼容旧版本支持的资源超卖特性,仍然保留了通过人工设置kubelet参数来开启资源超卖的能力,详情请参见kubelet超卖兼容模式(不推荐),但该方案仅支持基础能力,且不再演进,不支持CPU Burst、出口网络QoS分级控制等后续新特性。
PU的调度和隔离能力。 前提条件 配置 支持版本 集群版本 v1.23.8-r0、v1.25.3-r0及以上 操作系统 Huawei Cloud EulerOS 2.0操作系统 GPU类型 支持T4、V100类型的GPU 驱动版本 GPU虚拟化功能仅支持470.57.02、510
开启CPU Burst 约束与限制 集群版本:CCE Turbo集群且集群版本为v1.23.5-r0及以上。 OS版本:Huawei Cloud EulerOS 2.0。 集群中需要安装Volcano 1.9.0及以上版本的插件,且开启混合部署开关。 操作步骤 登录CCE控制台,单击集群名称进入集群。
特性开启后可能应用所需的系统调用会被runtime限制,所以开启后应确保在测试环境调试,不会对应用造成影响。 网络策略中的EndPort进入稳定阶段 Network Policy中的EndPort已进入稳定状态,该特性于1.21版本合入。主要是在NetworkPolicy新增E
特性开启后可能应用所需的系统调用会被runtime限制,所以开启后应确保在测试环境调试,不会对应用造成影响。 网络策略中的EndPort进入稳定阶段 Network Policy中的EndPort已进入稳定状态,该特性于1.21版本合入。主要是在NetworkPolicy新增E
log v1.19及以下版本集群:/var/paas/sys/log/kubernetes/kube-proxy.log yangtse日志(网络) v1.21及以上版本集群:/var/log/cce/yangtse v1.19及以下版本集群:/var/paas/sys/log/yangtse
"accessKey": "", "aomEndpoint": "https://***", "aomPrivateEndpointIP": "", "caCert": "", "clusterID": "",
激活成功后显示如下。 图2 激活成功 给集群所使用资源打标签。 集群所使用资源包括集群Master节点、节点,存储资源(EVS、SFS、OBS等),网络资源(ELB、EIP等)。其中节点会默认添加CCE-Cluster-ID标签。 给集群添加标签。 在CCE控制台进入集群信息页面,在资源标签处给集群打标签。
od重建,访问将恢复。 问题场景三:部分老版本的CCE插件存在该异常 请将老版本的CCE插件升级至最新版本。例如1.2.2以下的CCE容器网络扩展指标插件存在该问题,需升级至1.2.2及以上版本。 问题场景四:日志分析里面出现“failed to execute docker ps
离。 下列检查项中若未明确指出检查周期,则默认周期为30秒。 表4 系统组件检查 故障检查项 功能 说明 容器网络组件异常 CNIProblem 检查CNI组件(容器网络组件)运行状态 无 容器运行时组件异常 CRIProblem 检查节点CRI组件(容器运行时组件)Docker和Containerd的运行状态
l连接到集群,详情请参见通过kubectl连接集群。 您已经创建好一个状态可用的SFS Turbo,并且SFS Turbo与集群在同一个VPC内。 通过控制台动态创建SFS Turbo子目录 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏选择“存储”,在右侧选择“存储卷声
007250b0c 1Gi RWX csi-nas 71s StatefulSet的网络标识 StatefulSet创建后,可以看下Pod是有固定名称的,那Headless Service是如何起作用的呢,那就是使用DNS,为