检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
插件安装驱动时,插件里负责安装驱动的Pod的镜像tag,一般与device_version相同 obs_url 是 String 当从默认驱动地址中下载GPU驱动时,该值为GPU的驱动地址 swr_addr 是 String 镜像仓库地址 swr_user 是 String 镜像仓库租户路径 表3 custom
的规则,详情请参见使用RBAC鉴权。 ClusterRole:ClusterRole是一个集群级别的资源,可设置集群的访问权限。 Role:Role用于在某个命名空间内设置访问权限。当创建Role时,必须指定该Role所属的命名空间。 图2 自定义权限 单击“确定”。 父主题: API&kubectl
pod的内存的limit设置较小,实际使用率超过limit,导致容器触发了OOMkill。 解决方法: 扩大工作负载内存的limit设置。 示例 本例将创建一个Pod尝试分配超过其限制的内存,如下这个Pod的配置文档,它申请50M的内存, 内存限制设置为100M。 memory-request-limit-2
语法结构及示例,请参见IAM权限管理说明。 权限根据授权的精细程度,分为角色和策略。角色以服务为粒度,是IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。策略以API接口为粒度进行权限拆分,授权更加精细,可以精确到某个操作、资源和条件,能够满足企业对权限最小化的安全管控要求。
当上述容忍度的设置填写错误时,可能会出现调度问题。例如以下的容忍策略: tolerations: - operator: "Exists" 上述例子中只填写了operator参数为Exists(此时容忍度不能指定value参数)。 当一个容忍度的operator参数为Exists但key为空时,
选择自定义指标 示例中以cce_gpu_memory_utilization(GPU显存使用率)作为伸缩指标,其余HPA参数的设置请根据实际需求进行设置,详情请参见创建HPA策略。 返回“策略”页面,查看HPA策略已创建成功。 图5 HPA策略创建成功 父主题: GPU调度
容器运行时(docker)的路径 /var/lib/docker 数据盘空间分配设置为“共享磁盘空间”: /mnt/paas/runtime 同时创建了/var/lib/docker -> /mnt/paas/runtime的软链接 数据盘空间分配设置为“指定磁盘空间”:与Kubernetes原始路径保持一致,即/var/lib/docker
手动扩容策略 当节点池进行手动扩缩容时,您可选择指定的规格进行伸缩。当选择的节点规格资源不足或配额不足时,会导致扩容失败。 设置优先级 关于如何设置节点池规格优先级详情请参见配置集群弹性伸缩策略。 父主题: 节点弹性伸缩
1命令可以延迟1分钟重启。 在节点状态为可用状态之后,手动进行节点重启。 操作步骤 登录CCE控制台,在左侧导航栏中选择“集群管理”,单击要创建节点的集群进入集群控制台。 在集群控制台左侧导航栏中选择“节点管理”,切换至“节点”页签,单击右侧“创建节点”,并设置节点参数。 在“高级配置”中,填写安装前/后执行脚本。
1命令可以延迟1分钟重启。 在节点状态为可用状态之后,手动进行节点重启。 操作步骤 登录CCE控制台,在左侧导航栏中选择“集群管理”,单击要创建节点的集群进入集群控制台。 在集群控制台左侧导航栏中选择“节点管理”,切换至“节点”页签,单击右侧“创建节点”,并设置节点参数。 在“高级配置”中,填写安装前/后执行脚本。
为Pod配置EIP 使用场景 云原生网络2.0网络模式下,Pod使用的是VPC的弹性网卡/辅助弹性网卡,可直接绑定弹性公网IP。 为方便用户在CCE内直接为Pod关联弹性公网IP,用户只需在创建Pod时,配置annotation(yangtse.io/pod-with-eip:
ers,并且相关的清理操作被卡住或没有响应,则Pod将保持在Terminating状态。 Pod设置了terminationGracePeriodSeconds优雅退出时间:Pod设置优雅退出时间后,结束Pod时会进入Terminating状态,等待容器优雅退出后将会自动删除。 解决方法
UID”的拼接组合,如果不填写该参数,默认前缀为“pvc”。 取值范围:参数值长度为1~26,且必须是小写字母、数字、中划线,不能以中划线开头或结尾。 例如,存储卷名称前缀设置为“test”,则实际创建的底层存储名称test-{uid}。 storage 是 PVC申请容量,单位为Gi和Mi。 说明:
进行转发。 转发策略的优先级设置规则如下: 配置高级转发策略前已有的转发策略会继承原有的优先级顺序。 配置高级转发策略后,每次新增的转发策略优先级排序最低(默认转发策略固定为最低优先级,不参与排序)。您也可以手动指定新增的转发策略优先级,详情请参见为ELB Ingress配置转发规则优先级。
录均会被删除。 说明: 删除子目录时,仅删除PVC参数中设置的子目录绝对路径,不会级联删除上层目录。 storage 是 PVC申请容量,单位为Gi。 对SFS子目录类型的PVC来说,此处仅为校验需要(不能为空和0),设置的大小不起作用,此处可以设定为固定值1Gi。 执行以下命令,创建PVC。
nf_conntrack_tcp_be_liberal /etc/sysctl.conf 参数值为0或1。 0:表示关闭,所有不在TCP窗口中的包都被标志为无效。 1:表示开启,只有不在TCP窗口内的包被标志为无效。容器场景下,开启这个参数可以避免NAT过的TCP连接带宽受限。 查看参数: sysctl
修复伸缩组资源不足时无法正常修复节点池数量问题 1.23.0 1.23.17 v1.23 适配NPU和安全容器 节点伸缩策略支持不设置步长 bug修复,自动移除已删除的节点池 设置优先调度 注册EmptyDir调度策略 修复停用节点伸缩策略时,低于缩容阈值的节点未触发缩容的问题 修改自定义规格的内存申请与限制
工作负载异常:OOM问题 问题现象 若因OOM被终止的进程为容器的阻塞进程,可能会导致容器异常重启。 问题原因 容器不允许使用超过其限制的内存,超过后容器可能会被终 止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,可以参考为容器和Pod分配内存资源。 解决方案 登录CCE控制台。
也包括离线类型。根据应用对资源质量需求的差异,在线应用可以归纳为延时敏感型LS(Latency Sensitive),通常对请求压力(QPS)或访问延迟(RT)等指标有明确的要求,对资源质量较为敏感;离线应用可以归纳为资源消耗型BE(Best Effort),通常是一些计算密集型
emptyDir: medium: Memory # emptyDir磁盘介质:设置为Memory时,表示开启内存;设置为空时为原生默认的存储介质类型 sizeLimit: 1Gi # 卷容量大小 创建工作负载。