检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新安全组只对新创建或纳管的节点生效,存量节点需要手动修改节点安全组规则,即使对存量节点进行重置,也仍会使用原安全组。如需批量修改存量节点的安全组设置,请参考如何批量修改集群node节点安全组?。 图2 编辑节点默认安全组 父主题: 管理集群
用的资源进行调度,确保关键业务的资源优先级得到保障。 业务优先级保障调度 AI任务性能增强调度 根据AI任务的工作性质、资源的使用情况,设置对应的调度策略,可以增强集群业务的吞吐量,提高业务运行性能。 AI任务性能增强调度 NUMA亲和性调度 Volcano可解决调度程序NUMA拓扑感知的限制,实现以下目标:
选择合适的节点数据盘大小 节点池日常管理实践 存储扩容 通过Core Dump文件定位容器问题 容器与节点时区同步 将节点容器引擎从Docker迁移到Containerd CCE节点安全配置建议 节点池弹性伸缩实践 使用HPA+CA实现工作负载和节点联动弹性伸缩 父主题: 节点池
nginx:v1 swr.cn-east-3.myhuaweicloud.com/container/nginx:v1 docker push swr.cn-east-3.myhuaweicloud.com/container/nginx:v1 使用相同的方法制作v2版本镜像并上传至镜像仓库。
action: keep source_labels: - __meta_kubernetes_pod_container_port_name regex: web kubernetes_sd_configs: -
操作,无需手动填写节点标签和标签值。指定节点使用的是 kubernetes.io/hostname 标签,指定可用区使用的是 failure-domain.beta.kubernetes.io/zone 标签。 表3 节点亲和性调度策略设置参数说明 参数 参数说明 示例 权重 仅
obs:bucket:ListBucket 列举桶内对象 OBS:*:*:object:cost/daily_cost_{region_id} 资源对象路径限制 OBS:*:*:bucket:cce-cost-{region_id}-{domain_id} 资源桶限制 CIACostProjectPolicy 自定义策略
试创建节点是否正常使用。 您可以执行以下步骤确认GPU插件的升级目标版本与当前驱动配置。 登录CCE控制台,前往“插件中心”处查看CCE AI套件(NVIDIA GPU)插件。 单击该插件的“升级”按钮,查看插件目标版本及驱动版本。 在测试环境验证安装升级目标版本的GPU插件,并
labels: app: web-local spec: containers: - name: container-1 image: nginx:latest volumeMounts:
single-numa-node # set the topology policy spec: containers: - name: container-1 image: nginx:alpine resources:
labels: app: nginx-emptydir spec: containers: - name: container-1 image: nginx:latest volumeMounts:
在拉取镜像时报错“Auth is empty, only accept X-Auth-Token or Authorization”。 Failed to pull image "IP地址:端口号/magicdoom/tidb-operator:latest": rpc error:
ar/log/cce/kubernetes/kubelet.log路径查询kubelet日志,出现以下错误提示: ...unmount failed: exit status 32...Output: umount: <mount-path>: target is busy 问题根因
节点Python命令检查异常处理 ASM网格版本检查异常处理 节点Ready检查异常处理 节点journald检查异常处理 节点干扰ContainerdSock检查异常处理 内部错误异常处理 节点挂载点检查异常处理 K8s节点污点检查异常处理 everest插件版本限制检查异常处理
template: metadata: labels: app: nginx spec: containers: - image: nginx:alpine name: nginx imagePullSecrets:
def swr_region = 'cn-east-3' //定义需要上传的SWR组织名称 def organization = 'container' //定义镜像名称 def build_name = 'jenkins-demo' //部署集群的证书ID def credential
labels: app: nginx-hostpath spec: containers: - name: container-1 image: nginx:latest volumeMounts:
requestsMem 是 String 申请的内存大小,单位:Mi 表5 npc字段数据结构说明 参数 是否必选 参数类型 描述 maxTaintedNode 是 String or Int 单个故障在多个节点间发生时,至多多少节点允许被npc添加污点,避免雪崩效应。 支持int格式和百分比格式。
力、管理成本,且效率不高。 容器镜像服务支持Linux、ARM等多架构容器镜像托管。企业可以将镜像仓库迁移到容器镜像服务,节省运维成本。 如何把已有的镜像仓库平滑地迁移到容器镜像服务?这里将介绍3种常见的方案,您可以根据自己的实际使用场景来选择。 迁移方案 表1 迁移方案及适用场景对比
without ipv4 private ip, please bind private ip tothese elbs and try again 方法二:登录CCE控制台,前往“服务”页面查看服务,单击ELB名称,跳转到ELB界面。 确认ELB实例是否包含IPv4私网IP。 为无