检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
m-target)时,只会预热nic-maximum-target与节点当前绑定的容器网卡数的差值。 配置建议: 建议设置为2,此参数提供了动态预热能力,保证了节点始终有一定数量的预热网卡,建议配置为大部分节点日常10s内会瞬时弹性扩容的Pod数。 预热容器网卡回收阈值 节点预热容器网卡回收阈值
请输入缩容和扩容的冷却时间,单位为分钟,缩容扩容冷却时间不能小于1分钟。 该设置仅在1.15到1.23版本的集群中显示。 策略成功触发后,在此缩容/扩容冷却时间内,不会再次触发缩容/扩容,目的是等待伸缩动作完成后在系统稳定且集群正常的情况下进行下一次策略匹配。 伸缩配置 该设置仅在1.25及以上版本的集群中显示。 系
挂载绑定后,也能够正常访问,无需额外适配。 链改挂载绑定后,在到源目录和目标目录会存在两个相同的路径结构。并且在公共父目录下查找文件时,会在不同路径下查询到同一个文件。 例如:/var/lib/kubelet 和 /mnt/paas/kubernetes/kubelet 对应挂载
erNoSchedule或NoExecute。 字段使用场景:在节点创建场景下,支持指定初始值,查询时不返回该字段;在节点池场景下,其中节点模板中支持指定初始值,查询时支持返回该字段;在其余场景下,查询时都不会返回该字段。 示例: "taints": [{ "key": "status"
erNoSchedule或NoExecute。 字段使用场景:在节点创建场景下,支持指定初始值,查询时不返回该字段;在节点池场景下,其中节点模板中支持指定初始值,查询时支持返回该字段;在其余场景下,查询时都不会返回该字段。 示例: "taints": [{ "key": "status"
自动将基于Docker Registry v2搭建的Docker镜像仓库中的镜像迁移到SWR中。 准备工作 在开始迁移之前,请确保您已准备了一台安装了kubectl的服务器,用于连接源集群和目标集群。该服务器需要至少拥有5GB左右的本地磁盘空间和≥8G的内存,以确保迁移工具可以正
痛点问题,大幅度提升整体训练性能。详情请参见组调度(Gang)。 组调度的具体算法是,观察Job下的Pod已调度数量是否满足了最小运行数量,当Job的最小运行数量得到满足时,为Job下的所有Pod执行调度动作,否则,不执行。 主要适用于需要多进程协作的场景: AI场景往往包含复杂的流程,Data
集群中业务的吞吐量,适用单次AI训练、单次大数据计算以及查询等批处理小业务场景。 启用公平调度(DRF)后,可增强集群业务的吞吐量,提高业务运行性能。详情请参见公平调度(DRF)。 组调度(Gang) Gang调度策略满足了调度过程中的“All or nothing”的调度需求,
使用场景 由于不同VPC之间网络不通,CCE集群无法跨VPC进行网络通信,您可以通过对等连接连通两个不同网段的VPC,实现本VPC下的集群访问另一个VPC下的集群或其他服务。 图1 网络示意 为实现跨VPC访问,不同网络模型的集群需要打通的网段不同。假设集群本端VPC网段为172.16
节点池架构 图1 节点池整体架构图 通常情况下,节点池内的节点均具有如下相同属性: 节点操作系统。 节点登录方式。 节点容器运行时。 节点所属企业项目。 节点Kubernetes组件启动参数。 节点自定义启动脚本。 节点“K8s标签”及“污点”设置。 此外,CCE将同时围绕节点池扩展以下属性:
ainer_cpu_usage_core_per_second。 重新部署monitoring命名空间下的custom-metrics-apiserver工作负载。 执行命令查看指标是否添加成功。 kubectl get --raw "/apis/custom.metrics.k8s
rule-priority-enabled”注解设置为“true”时,根据创建Ingress时的转发规则先后顺序进行排序,配置在上面的优先级高;未配置该注解时,同一个Ingress的转发规则会使用ELB侧的默认排序。 未配置以上注解时,同一个ELB监听器下无论包含多个Ingress还是同一个
在续费管理页面开通自动续费 在费用中心开通自动续费的方法适合所有资源,包括集群、节点、云硬盘、弹性公网IP等。 进入“续费管理”页面。 自定义查询条件。 可在“自动续费项”页签查询已经开通自动续费的资源。 可对“手动续费项”、“到期转按需项”、“到期不续费项”页签的资源开通自动续费。 图2 续费管理 为包年/包月资源开通自动续费。
登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“服务”,在右上角单击“创建服务”。 设置Service参数。本示例中仅列举必选参数,其余参数可根据需求参考创建LoadBalancer类型Service进行设置。 Service名称:自定义服务名称,可与工作负载名称保持一致。 访问类型:选择“负载均衡”。
Taskmanager”,查看该任务的Endpoint,根据Endpoint可以进一步得知该任务对应的TaskManager Pod。 图5 查看Endpoint 查找Endpoint对应的TaskManager Pod。在命令行界面输入以下命令,查看Flink相关Pod对应的IP地址。
节点池批量扩缩容节点时,Kubernetes Event事件存在部分缺失。 例如,集群中批量缩容10个节点,CCE打印了10次“删除节点”事件,但是Kubernetes仅打印了4次“缩容空闲节点启动”的Event事件。 问题根因 出现该问题的原因是Kubernetes在处理Event事件
方法二:登录CCE控制台,前往“服务”页面查看服务,单击ELB名称,跳转到ELB界面。 确认ELB实例是否包含IPv4私网IP。 为无IPv4私网IP地址的ELB绑定一个私网IP。 登录CCE控制台,单击目标ELB名称。 在基本信息页面,单击“IPv4私有IP”旁的“绑定”。 设置子网及IPv4地址,并单击“确定”。
击“监控”。 单击“监控”页签顶部的“查看更多”,前往运维管理页面查看历史监控记录。 当节点cpu和内存负载过高时,会导致节点网络时延过高,或系统OOM,最终展示为不可用。 解决方案: 建议迁移业务,减少节点中的工作负载数量,并对工作负载设置资源上限,降低节点CPU或内存等资源负载。
pid_max,具体方法请参见配置节点池kernel.pid_max和创建节点时配置kernel.pid_max。 查看节点kernel.pid_max 登录节点,执行如下命令查看节点kernel.pid_max。 sysctl kernel.pid_max # sysctl kernel
duler的核心调度算法之一,它满足了调度过程中的“All or nothing”的调度需求,避免Pod的任意调度导致集群资源的浪费。具体算法是,观察Job下的Pod已调度数量是否满足了最小运行数量,当Job的最小运行数量得到满足时,为Job下的所有Pod执行调度动作,否则,不执行。