分布式云原生 UCS

分布式云原生 UCS

统一算力调度

覆盖华为云、多云、边缘云、客户IDC等场景,基于CPU、内存、流量等多种弹性策略可选择

统一配置管理

基于 GitOps 实现 Kubernetes 原生资源的声明式版本管理与自动化交付

统一智能运维

7*24h健康守护,全域监控、智能巡检 提供运维标准接口,支持对接到第三方监控日志运维系统

连接并管理任何地域、任何基础设施上的Kubernetes集群

连接并管理任何地域、任何基础设施上的Kubernetes集群

集群类型

华为云集群

UCS(Huawei Cloud)

本地集群

UCS(On-Premises)

多云集群

UCS(Multi-cloud clusters)

附着集群

UCS(Attached clusters)
简介

包括华为云CCE Standard集群CCE Turbo集群

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群,支持离线场景

由UCS提供的运行在第三方云服务供应商(如AWS)基础设施之上的Kubernetes集群

满足CNCF标准的第三方Kubernetes集群,如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

集群资源由华为云全托管,简化业务上云流程

由华为云提供,支持本地化部署,可实现华为云与您的数据中心资源相互协同

由华为云提供,支持在AWS等第三方服务供应商的基础设施上自动化构建

部署在第三方云厂商或本地自建的Kubernetes集群

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划;拥有本地自建的Kubernetes集群,希望业务在波峰期能快速弹性上云

拥有自建的数据中心(IDC);对数据安全和可靠性存在强诉求的金融、证券等行业;需构建灵活弹性的AI基础设施,加速AI训练和推理

拥有第三方云服务供应商基础设施资源,希望通过华为云UCS做统一的多云管理入口,将应用部署到多个云中

已有业务部署在其他云厂商或者自建的Kubernetes集群中,期望通过多云平台,对业务混合部署提升应用的可靠性

华为云集群

UCS(Huawei Cloud)
简介

包括华为云CCE Standard集群CCE Turbo集群

部署形态

集群资源由华为云全托管,简化业务上云流程

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划;拥有本地自建的Kubernetes集群,希望业务在波峰期能快速弹性上云

本地集群

UCS(On-Premises)
简介

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群,支持离线场景

部署形态

由华为云提供,支持本地化部署,可实现华为云与您的数据中心资源相互协同

适用场景

拥有自建的数据中心(IDC);对数据安全和可靠性存在强诉求的金融、证券等行业;需构建灵活弹性的AI基础设施,加速AI训练和推理

多云集群

UCS(Multi-cloud clusters)
简介

由UCS提供的运行在第三方云服务供应商(如AWS)基础设施之上的Kubernetes集群

部署形态

由华为云提供,支持在AWS等第三方服务供应商的基础设施上自动化构建

适用场景

拥有第三方云服务供应商基础设施资源,希望通过华为云UCS做统一的多云管理入口,将应用部署到多个云中

附着集群

UCS(Attached clusters)
简介

满足CNCF标准的第三方Kubernetes集群,如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

部署在第三方云厂商或本地自建的Kubernetes集群

适用场景

已有业务部署在其他云厂商或者自建的Kubernetes集群中,期望通过多云平台,对业务混合部署提升应用的可靠性

为什么选择华为云UCS服务

提升管理效率,跨云、跨地域集群统一管理

提升管理效率,跨云、跨地域集群统一管理

  • 统一集群接入:支持公网/VPN/专线多种接入方式

  • 统一资源视图:多集群统一视图,提供全局集群资源和应用分布大屏

  • 统一权限管理:提供一致性权限管理所有集群,支持企业级的用户权限管理

华为云与本地IDC协同,实现弹性上云

华为云与本地IDC协同,实现弹性上云

  • 构筑本地集群极速弹性上云,流量高峰,业务云上秒级扩容

  • 结合Volcano以及HCE OS 2.0能力,构建本地集群在线、离线混部能力,资源利用率提升40%

  • 在AI训练和AI推理场景下,通过GPU虚拟化技术实现GPU隔离以及资源利用率提升

云原生应用全景观测,大幅提升运维效率

云原生应用全景观测,大幅提升运维效率

  • 全景可观测,全域集群运维统一视图

  • 全域集群智能巡检,自动化实现集群健康守护

  • 提供运维系统标准接口,通过REST API、Exporter等方式快速对接到第三方监控日志运维系统

多集群管理基石——Karmada

多集群管理基石——Karmada

  • 跨集群调度策略:支持ClusterName、Label、Taints和Tolerations、集群拓扑等多种调度策略

  • 跨集群故障迁移:集群发生故障后,将故障集群实例进行自动调度到健康集群

  • 跨集群弹性伸缩:应用可根据不同集群权重进行实例分配

  • 跨集群流量分发:可以根据权重、优先级、自动均衡等多种配置实现

丰富的应用场景,快速实现业务部署

全域管理
方案概述

为集团型企业打造全域一朵云,实现跨云跨地域Kubernetes集群的统一管理、统一运维、统一配置和统一生态,建设简约高效的云原生数字化平台。

业务痛点
管理效率低

集团型企业在各地设立分支机构,基础设施复杂,导致管理效率低下和人力成本增加

故障响应慢

缺乏全局统一的洞察分析工具,故障感知能力弱,故障响应周期长

缺少轻量化云化方案

无法充分利用现有的硬件和虚拟化环境,保护已有的投资

方案价值
1.对集团分支机构统一管理,有效提升管理效率
2.全栈云原生加持,业务开发测试更加敏捷、交付运维更加便利、弹性伸缩更加迅速
3.轻量化部署本地集群服务,只需三台物理机或虚拟机即可构建云原生容器平台
AI计算
方案概述

基于UCS云服务,打造了灵活弹性的AI容器基础设施,通过HCE OS调优、volcano调度器和GPU虚拟化,为客户提供高效可扩展的计算平台,优化AI模型训练和推理,助力企业快速部署AI大模型,加速智能应用创新。

业务痛点
GPU资源利用率低

AI训练和推理场景,往往不能将GPU资源充分利用,无法做到GPU资源精细管理,导致算力资源严重浪费

训练调度难,容易出现死锁

计算密集型模型通常采用分布式训练,但训练过程易出现忙等和死锁问题,需要优化调度来提升效率

方案价值
1.华为自研的GPU虚拟化技术,实现算力和显存强隔离,使得GPU资源利用率提升20%
2.通过volcano调度器提供的Gang Scheduling、IO aware scheduling等调度算法,解决了分布式训练的忙等、死锁和IO通信密集等问题
现代化应用交付
方案概述

华为云 CodeArts 提供可视化、可定制的持续交付流水线服务,结合 GitOps的发布回滚和版本迭代控制,将交付周期从一周缩短至一天,显著加速了多云环境下的应用交付与运维。

业务痛点
多集群场景应用交付复杂

在多集群场景下,应用程序需在公有云、本地或边缘等配置各异的环境中部署,导致交付和管理变得更加复杂且具有挑战性

多集群场景应用运维复杂

多集群环境下,由于缺乏统一管理和监控,运维难度加大,风险难以及时发现和控制

方案价值
1.生态开放,配合华为云CodeArts实现开箱即用的流水线解决方案
2.基于GitOps,提供可审计、可持续的部署能力
3.多集群业务全景可观测,风险提前感知
多活容灾
方案概述

为构建高可用的云应用系统,我们采用多活容灾方案,通过在多个云平台同时运行应用来提高可靠性。该架构包括跨云负载均衡、实时数据同步和自动故障切换,确保系统在任何单点故障时仍能持续运行,从而显著提升了系统的稳定性和容错能力。

业务痛点
单点故障风险

如果应用仅在单一数据中心或者云平台上运行,一旦发生故障,整个系统可能会中断,导致业务停摆和客户体验受损

灾难恢复时间长

在单一环境中发生灾难时,恢复时间可能较长

资源利用不均衡

由于业务流量波动和配置不当,导致部分节点资源消耗过高而其他节点闲置的现象

方案价值
1.提高业务系统的高可用性,减少单点故障导致的服务中断
2.通过跨云负载均衡和数据同步,能够更好地分配资源和优化性能
3.使用多个云服务提供商或数据中心可降低对单一供应商的依赖
即刻开启
您的

分布式云原生

之旅
购买

您可能感兴趣的产品

您可能感兴趣的产品