检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
containerd节点: crictl ps --no-trunc | grep k8s_coredns | awk '{print $1}' 完整的命令示例如下: cat /sys/fs/cgroup/cpu/kubepods/pod27f58662-3979-448e-8f57-09b62b
点,并单击“标签与污点管理”。 单击“新增批量操作”,为GPU/NPU节点添加污点。 选择“污点(Taints)”,并填写键值与污点效果。示例中,为GPU/NPU节点添加accelerator=true:NoSchedule的污点。 图1 添加污点 创建GPU/NPU工作负载时,
--no-trunc | grep {pod id} | grep {container name} | awk '{print $1}' 完整示例如下: cat /sys/fs/cgroup/cpuset/kubepods/podc1fcd22d-8a83-4aef-a27a-4c0
使用了两个独立的Kubernetes集群进行高度隔离,分别用于测试环境和生产环境。 以下是从源码编译、镜像构建、应用测试到生产上线的全流程示例: 首先在Gitlab中创建一个新的Git仓库,并将其与Jenkins进行关联。 在Jenkins中创建一个新的构建作业,并配置其使用Gitlab的Git仓库。
由于gitRepo存储卷已被弃用,社区建议的解决方案是使用initContainers容器执行Git克隆操作,然后将目录挂载至Pod容器中,请参见社区示例。 相关链接 https://github.com/kubernetes/kubernetes/issues/128885 父主题: 漏洞公告
com/kubernetes-sigs/externalip-webhook。 方法二:使用开源软件OPA Gatekeeper限制externalIP的使用。示例说明ConstraintTemplate和Constraint发布在:https://github.com/open-policy-age
功能、优化。您可通过CCE集群版本发布说明查看最新版本的特性说明。 避免大跨度兼容风险:Kubernetes版本的迭代过程中,会不断带来API变更与功能废弃。长久未升级的集群,在需要升级时需要更大的运维保障投入。周期性的跟随升级能有效缓解版本差异累积导致的兼容性风险。建议用户每季
持成本治理功能运行需要。 为了最小化授权,CCE服务进行了一次权限细粒度化改造,将由系统策略为粒度的权限集,修改为Action(依赖调用的接口对应一个Action)粒度的权限集。如果您已经进行了服务授权,可以一键进行权限优化,优化您授权的权限。 当您同意授权后,将在IAM中自动创
会为0。 使用示例 使用基于Pod实例画像的资源超卖前 确认专家模式中,oversubscription_method配置项的值为“nodeResource”,这表明当前集群采用的为默认的基于节点资源用量的算法。 通过CCE控制台,创建一个redis工作负载作为示例,并绑定一个“节点访问”类型的服务。
求较高,如广告业务、电商业务等。 离线作业:往往运行时间短,计算需求大,可容忍较高的时延,如AI/大数据业务。 功能介绍 功能 描述 参考文档 动态资源超卖 根据在线作业和离线作业类型,通过Volcano调度将集群中申请而未使用的资源(即申请量与使用量的差值)利用起来,实现资源超卖和混合部署,提升集群资源利用率。
webhook。kruise-controller-manager会创建webhook configurations来配置哪些资源需要感知处理,并为kube-apiserver提供可调用的Service。 Deployment kruise-daemon 通过DaemonSet部署到每个节点上,提供镜像预热、容器重启等功能。
in组成。action定义了调度各环节中需要执行的动作;plugin根据不同场景提供了action 中算法的具体实现细节。 您可以根据官方文档中对每个action和plugin的说明,定义专属于您的调度策略。 详情可参见:https://support.huaweicloud.c
--dport 80 -m limit --limit 25/minute --limit-burst 100 -j ACCEPT 此处的脚本示例仅供参考。 完成以上配置后,您可以设置需要购买的节点数量,并单击“下一步:规格确认”。 单击“提交”,开始创建节点。 父主题: 节点运维
--dport 80 -m limit --limit 25/minute --limit-burst 100 -j ACCEPT 此处的脚本示例仅供参考。 完成以上配置后,您可以设置需要购买的节点数量,并单击“下一步:规格确认”。 单击“提交”,开始创建节点。 父主题: 集群
仅支持使用Docker容器引擎: Docker in Docker(通常在CI场景)。 节点上使用Docker命令。 调用Docker API。 节点操作系统 由于业务容器运行时共享节点的内核及底层调用,为保证兼容性,建议节点的操作系统选择与最终业务容器镜像相同或接近的Linux发行版本。
通过kubectl对接集群,手动清理该插件release对应的secret及configmap。以下以清理autoscaler插件release为示例。 配置kubectl对接集群后,执行以下命令查看插件相关的release的secret列表。 kubectl get secret -A
导致节点上的负载无法重新拉起,也无法创建新负载。 登录CCE节点(弹性云服务器)并删除cpu_manager_state文件。 删除命令示例如下: rm -rf /mnt/paas/kubernetes/kubelet/cpu_manager_state 重启节点或重启kubelet,重启kubelet的方法如下:
CronHPA查询关联HPA失败 FailedGetHorizontalPodAutoscaler 重要 CronHPA查询关联的HPA对象失败(通常是kube-apiserver侧响应失败)。 CronHPA CronHPA查询伸缩对象失败 FailedGetHpaScale 重要 CronHPA获取待伸缩资源对象失败。
启驱动选择时,如从控制台创建NPU节点,控制台会自动补充NPU驱动(用户无法指定版本和类型)安装命令,并在安装完成后自动重启节点;如通过API或其他方式创建节点则需要用户在“安装后执行脚本”中添加驱动安装命令。 支持的NPU卡类型和对应的操作系统规格如下: NPU卡类型 支持的操作系统
服务器并使用密钥对SSH登录,需要提前确保临时ECS服务器指定的安全组放开TCP:22端口通道,允许执行机SSH登录。详情请参考安全组配置示例。 制作过程中: 制作镜像的过程中必须按照操作指南进行制作,防止一些不可预期问题出现。 根据基础镜像创建出来的虚机,默认SSH登录用户需要支持sudo