检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
中的两个核心设计:全域统一调度和资源分级管控。 全域统一调度和资源分级管控 全域统一调度 应用的全域统一调度的核心是全域和统一,比如:分布式云场景中跨云、跨集群的统一调度,以及不同在线应用、离线任务的统一调度。 首先,Volcano通过静态分析,获取应用的静态特征,如:CPU、内
创建容器工作负载 在本章节中,您将会把应用部署到CCE中。首次使用CCE时,您需要创建一个初始集群,并添加一个节点。 应用镜像上传到容器镜像服务后,部署容器应用的方式都是基本类似的。不同点在于是否需要设置环境变量,是否需要使用云存储,这些也是和业务直接相关。 使用云服务 云容器引
Turbo、CCE Autopilot三种集群,支持管理虚拟机节点或裸金属节点,支持虚拟机与物理机混用场景。 一站式自动化部署和运维容器应用,整个生命周期都在容器服务内一站式完成。 通过Web界面轻松实现集群节点和工作负载的扩容和缩容,自由组合策略以应对多变的突发浪涌。 通过Web界
可用UTF-8格式表示的汉字、字母、数字和空格 支持部分特殊字符:_.:=+-@ 不能以"_sys_"开头 默认取值: 不涉及 value 否 String 参数解释: Value值。 约束限制: 不涉及 取值范围: 可以为空但不能缺省,最多支持255个字符 可用UTF-8格式表示的汉字、字母、数字和空格
准确的周期;而使用其他周期时,在新的一天开始时,最后一个周期将会被重置。比如CRON式为“* */12 * * *”时为准确的周期,每天的执行时间为00:00:00和12:00:00;而CRON式为“* */13 * * *”时,每天的执行时间为00:00:00和13:00:00
推出新功能、语言、框架和技术都比较困难。 方式二: 先将部分组件容器化(将对弹性扩展要求高,或更新频繁的组件拆分出来,先容器化改造) 渐进式变革:在原有架构推倒重建太伤筋动骨,通过较为缓和的改动,更容易接受。 弹性更灵活:将对弹性要求高的组件容器化,当需要扩展时,只针对该容器扩展,弹性更灵活,且能降低系统资源。
Standard/CCE Turbo ClusterIP:通过集群的内部 IP 暴露服务,选择该值时服务只能够在集群内部访问。 这也是你没有为服务显式指定 type 时使用的默认值。 你可以使用 Ingress 或者 Gateway API 向公众暴露服务。 NodePort:通过每个节点上的
计费项 使用云容器引擎服务时,产生的总费用由集群费用和其他云服务资源费用组成。 CCE Standard和Turbo集群计费项 图1 计费项 标 * 的计费项为必选计费项。 表1 使用CCE Standard和Turbo集群的费用组成 计费项 计费项说明 适用的计费模式 计费公式
_threads) 可视化界面配置 CCE容器存储插件(Everest)中同时处理卸载EVS卷的worker数,默认值均为“60”。 分布式挂卷策略(enable_node_attacher) 可视化界面配置 开启时,由每个节点上的everest-csi-driver组件负责attach/detach
ingress.kubernetes.io/rewrite-target”注解中,作为重写后的URL路径。 例如,上面的Ingress正则匹配式将导致多种情况的URL重写,可能的情形如下: 访问“/something”路径重写为“/”路径 访问“/something/”路径重写为“/”路径
CPU管理策略通过kubelet参数--cpu-manager-policy来指定。Kubernetes默认支持两种策略: none:默认策略,显式地启用现有的默认CPU亲和方案,不提供操作系统调度器默认行为之外的亲和性策略。 static:针对CPU申请值设置为整数的Guaranteed
Kubernetes资源管理:在进行创建、删除、更新或查询 Kubernetes 资源的操作时,可能会出现失败的情况。 Kubernetes分布式选主:在基于Kubernetes Lease选主的分布式应用中,可能会因Lease续期请求超时而导致主实例重启。 例如npd插件的controller组件,Lease续
or nothing”的调度需求,避免Pod的任意调度导致集群资源的浪费,主要应用于AI、大数据等多任务协作场景。启用该能力后,可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题,大幅度提升整体训练性能。 前提条件 已创建v1.19及以上版本的集群,详情请参见购买Standard/Turbo集群。
Controller的实现。在CCE中会使用ingress.beta.kubernetes.io/url-match-mode指定的匹配方式,这与v1beta1方式相同。 Exact:精确匹配 URL 路径,且区分大小写。 Prefix:基于以 / 分隔的 URL 路径前缀匹配。匹配区分大小写,并且对路径中的元素逐个匹配。
CCE Turbo集群:基于云原生基础设施构建的云原生2.0容器引擎服务,具备软硬协同、网络无损、安全可靠和调度智能的优势,为用户提供一站式、高性价比的全新容器服务体验。支持裸金属节点。 CCE集群 *网络模型 VPC网络:采用VPC路由方式与底层网络深度整合,适用于高性能场景,
nothing”的调度需求,避免Pod的任意调度导致集群资源的浪费,应用于AI、大数据等多任务协作场景。 启用组调度(Gang)后,可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题,大幅度提升整体训练性能。详情请参见组调度(Gang)。 异构资源调度(Volcano调度器支持) 支持GPU资源调度
点上运行的业务容器是否可能发生重启,造成业务影响。 58 GPU插件关键参数检查异常处理 检查CCE GPU插件中部分配置是否被侵入式修改,被侵入式修改的插件可能导致升级失败。 59 GPU/NPU Pod重建风险检查异常处理 检查当前集群升级重启kubelet时,节点上运行的G
暂停集群升级任务(已废弃) 功能介绍 暂停集群升级任务。 集群升级涉及多维度的组件升级操作,强烈建议统一通过CCE控制台执行交互式升级,降低集群升级过程的业务意外受损风险; 当前集群升级相关接口受限开放。 调用方法 请参见如何调用API。 URI POST /api/v3/pro
进行乘法、加法、连接、取分数位等操作。 易于管理:Prometheus server是一个单独的二进制文件,可直接在本地工作,不依赖于分布式存储。 高效:平均每个采样点仅占 3.5 bytes,且一个Prometheus server可以处理数百万的metrics。 使用pull
获取集群升级任务详情,任务ID由调用集群升级API后从响应体中uid字段获取。 集群升级涉及多维度的组件升级操作,强烈建议统一通过CCE控制台执行交互式升级,降低集群升级过程的业务意外受损风险; 当前集群升级相关接口受限开放。 调用方法 请参见如何调用API。 URI GET /api/v3