分布式云原生 UCS

分布式云原生 UCS

统一算力调度

覆盖华为云、多云、边缘云、客户IDC等场景,基于CPU、内存、流量等多种弹性策略可选择

统一流量治理

东西/南北流量全域统一治理,拥有流量切分、灰度发布、故障倒换等丰富的治理能力

统一配置管理

基于 GitOps 实现 Kubernetes 原生资源的声明式版本管理与自动化交付

统一智能运维

7*24h健康守护,全域监控、智能巡检 提供运维标准接口,支持对接到第三方监控日志运维系统

统一应用生态

150+应用生态开箱即用 一次上架全域分发,跨云一键部署

连接并管理任何地域、任何基础设施上的Kubernetes集群

连接并管理任何地域、任何基础设施上的Kubernetes集群

集群类型

华为云集群

UCS(Huawei Cloud)

伙伴云集群

UCS(Partner Cloud)

本地集群

UCS(On-Premises)

附着集群

UCS(Attached clusters)
简介

包括华为云CCE Standard集群CCE Turbo集群

包括伙伴云的CCE Standard集群和CCE Turbo集群

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群,支持离线场景

满足CNCF标准的第三方Kubernetes集群,如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

集群资源由华为云全托管,简化业务上云流程

集群资源由伙伴云全托管

由华为云提供,支持本地化部署,可实现华为云与您的数据中心资源相互协同

部署在第三方云厂商或本地自建的Kubernetes集群

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划;拥有本地自建的Kubernetes集群,希望业务在波峰期能快速弹性上云

已有业务部署在伙伴云集群,期望通过多云平台,对业务混合部署以提升应用的可靠性

拥有自建的数据中心(IDC);对数据安全和可靠性存在强诉求的金融、证券等行业;需构建灵活弹性的AI基础设施,加速AI训练和推理

已有业务部署在其他云厂商或者自建的Kubernetes集群中,期望通过多云平台,对业务混合部署以提升应用的可靠性

华为云集群

UCS(Huawei Cloud)
简介

包括华为云CCE Standard集群CCE Turbo集群

部署形态

集群资源由华为云全托管,简化业务上云流程

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划;拥有本地自建的Kubernetes集群,希望业务在波峰期能快速弹性上云

伙伴云集群

UCS(Partner Cloud)
简介

包括伙伴云的CCE Standard集群和CCE Turbo集群

部署形态

集群资源由伙伴云全托管

适用场景

已有业务部署在伙伴云集群,期望通过多云平台,对业务混合部署以提升应用的可靠性

本地集群

UCS(On-Premises)
简介

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群,支持离线场景

部署形态

由华为云提供,支持本地化部署,可实现华为云与您的数据中心资源相互协同

适用场景

拥有自建的数据中心(IDC);对数据安全和可靠性存在强诉求的金融、证券等行业;需构建灵活弹性的AI基础设施,加速AI训练和推理

附着集群

UCS(Attached clusters)
简介

满足CNCF标准的第三方Kubernetes集群,如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

部署在第三方云厂商或本地自建的Kubernetes集群

适用场景

已有业务部署在其他云厂商或者自建的Kubernetes集群中,期望通过多云平台,对业务混合部署以提升应用的可靠性

为什么选择华为云UCS服务

提升管理效率,跨云、跨地域集群统一管理

提升管理效率,跨云、跨地域集群统一管理

  • 统一集群接入:支持公网/VPN/专线多种接入方式

  • 统一资源视图:多集群统一视图,提供全局集群资源和应用分布大屏

  • 统一权限管理:提供一致性权限管理所有集群,支持企业级的用户权限管理

华为云与本地IDC协同,实现弹性上云

华为云与本地IDC协同,实现弹性上云

  • 构筑本地集群极速弹性上云,流量高峰,业务云上秒级扩容

  • 结合Volcano以及HCE OS 2.0能力,构建本地集群在线、离线混部能力,资源利用率提升40%

  • 在AI训练和AI推理场景下,通过GPU虚拟化技术实现GPU隔离以及资源利用率提升

云原生应用全景观测,大幅提升运维效率

云原生应用全景观测,大幅提升运维效率

  • 全景可观测,全域集群运维统一视图

  • 全域集群智能巡检,自动化实现集群健康守护

  • 提供运维系统标准接口,通过REST API、Exporter等方式快速对接到第三方监控日志运维系统

多集群管理基石——Karmada

多集群管理基石——Karmada

  • 跨集群调度策略:支持ClusterName、Label、Taints和Tolerations、集群拓扑等多种调度策略

  • 跨集群故障迁移:集群发生故障后,将故障集群实例进行自动调度到健康集群

  • 跨集群弹性伸缩:应用可根据不同集群权重进行实例分配

  • 跨集群流量分发:可以根据权重、优先级、自动均衡等多种配置实现

丰富的云原生服务生态

丰富的云原生服务生态

  • 提供100+开源应用、10+精选开源、20+商业应用

  • 支持用户订阅云原生服务,一键分发到UCS接入的集群及边缘节点

安全可靠,多云多集群安全策略统一管控

安全可靠,多云多集群安全策略统一管控

  • 利用OPA机制,统一管理各集群的安全策略的资源访问限制,便于多云多集群的合规性审计

  • 提供内置策略以及自定义策略,用于管理集群资源的安全合规性

丰富的应用场景,快速实现业务部署

全域管理
方案概述

为集团型企业打造全域一朵云,实现跨云跨地域Kubernetes集群的统一管理、统一运维、统一配置和统一生态,建设简约高效的云原生数字化平台。

业务痛点
管理效率低

集团型企业在各地设立分支机构,基础设施复杂,导致管理效率低下和人力成本增加

故障响应慢

缺乏全局统一的洞察分析工具,故障感知能力弱,故障响应周期长

缺少轻量化云化方案

无法充分利用现有的硬件和虚拟化环境,保护已有的投资

方案价值
1.对集团分支机构统一管理,有效提升管理效率
2.全栈云原生加持,业务开发测试更加敏捷、交付运维更加便利、弹性伸缩更加迅速
3.轻量化部署本地集群服务,只需三台物理机或虚拟机即可构建云原生容器平台
分布式应用开发
方案概述

构建企业级容器云平台——本地集群,为金融客户提供高效、安全的云原生解决方案,支持业务应用灵活部署、监控运维、成本可视化、弹性扩展等功能,保障业务稳定运行与数据安全,推动创新发展。

业务痛点
突发的海量交易

互联网业务增长带来突发海量交易,要求信息系统具备快速弹性扩展能力以应对高峰需求

应用开发迭代周期长

金融应用的快速迭代要求信息系统支持分布式开发,确保符合银行的技术规划和管理规范

国产化替代

响应信创要求,从数据处理到客户服务减少对外部技术的依赖

方案价值
1.基于FinOps理念,提供集群混合部署、资源超分、应用智能弹性和资源动态扩缩容,构建云原生全栈资源效能管理平台
2.以应用为中心,支持构建微服务化、容器化且可动态编排调度的高弹性云原生技术架构
3.全面兼容主流国产芯片和操作系统
AI计算
方案概述

基于UCS云服务,构建了一个灵活且弹性的AI容器基础设施,以充分释放AI大模型的算力潜能。通过HCE OS性能调优、volcano调度器加持和GPU虚拟化技术,为客户提供了一个高效、可扩展的计算平台,专门优化用于AI模型的训练和推理,助力企业高效实现AI大模型的部署和运行,推动智能应用的创新和发展。

业务痛点
GPU资源利用率低

AI训练和推理场景,往往不能将GPU资源充分利用,无法做到GPU资源精细管理,导致算力资源严重浪费

训练调度难,容易出现死锁

由于单机多卡难以满足算力需求,计算密集型模型通常采用分布式训练,但训练过程易出现忙等和死锁问题,需要优化调度来提升效率

方案价值
1.基于HCE OS性能调优,应用性能可提升10%~30%
2.通过volcano调度器提供的Gang Scheduling、IO aware scheduling等调度算法,解决了分布式训练的忙等、死锁和IO通信密集等问题,性能提升30%
3.华为自研的GPU虚拟化技术,实现算力和显存强隔离,使得GPU资源利用率提升20%
现代化应用交付
方案概述

华为云 CodeArts 提供可视化、可定制的持续交付流水线服务,结合 GitOps 引擎,实现发布回滚和版本迭代控制,并支持多集群环境中的持续部署,满足高可用应用的部署需求。这些功能将交付周期从一周缩短至一天,显著加速了多云环境下现代化应用的全生命周期交付与运维。

业务痛点
多集群场景应用交付复杂

在多集群场景下,应用程序需在公有云、本地或边缘等配置各异的环境中部署,导致交付和管理变得更加复杂且具有挑战性

多集群场景应用运维复杂

多集群环境下,由于缺乏统一管理和监控,运维难度加大,风险难以及时发现和控制

方案价值
1.生态开放,配合华为云CodeArts实现开箱即用的流水线解决方案
2.基于GitOps,提供可审计、可持续的部署能力
3.多集群业务全景可观测,风险提前感知
服务网格
方案概述

服务网格提供非侵入式的微服务治理方案,支持应用全生命周期管理和流量治理,兼容Kubernetes和Istio生态。其功能涵盖负载均衡、熔断、限流等治理能力,内置灰度发布流程,实现一站式自动化发布管理。基于无侵入的数据采集,提供实时流量拓扑、调用链等性能监控,构建全面的服务运行视图。

业务痛点
核心业务SLA要求高

核心业务系统对服务水平协议(SLA)的要求通常需要达到99.99%以上,为此必须部署在多集群、多可用区(AZ)甚至多云平台上,以提升可靠性

应用新版本上线切换风险高

应用程序在更新新版本时,面临的最大挑战是从测试阶段平稳过渡到生产环境,同时确保系统持续提供服务

方案价值
1.根据配置的服务流量分发策略,故障自动倒换,韧性增强
2.业务灰度发布,支持快速试错上线
3.提供精细化的流量管理,按照权重或者流量内容进行流量切分到不同的后端服务器
多活容灾
方案概述

为构建高可用的云应用系统,我们采用多活容灾方案,通过在多个云平台同时运行应用来提高可靠性。该架构包括跨云负载均衡、实时数据同步和自动故障切换,确保系统在任何单点故障时仍能持续运行,从而显著提升了系统的稳定性和容错能力。

业务痛点
单点故障风险

如果应用仅在单一数据中心或者云平台上运行,一旦发生故障,整个系统可能会中断,导致业务停摆和客户体验受损

灾难恢复时间长

在单一环境中发生灾难时,恢复时间可能较长,业务恢复的效率无法满足高可用性的要求

资源利用不均衡

由于业务流量波动和配置不当,导致部分节点资源消耗过高而其他节点闲置的现象

方案价值
1.提高业务系统的高可用性,减少单点故障导致的服务中断
2.通过跨云负载均衡和数据同步,能够更好地分配资源和优化性能
3.使用多个云服务提供商或数据中心可降低对单一供应商的依赖

携手客户持续业务创新

客户案例

即刻开启
您的

分布式云原生

之旅
购买

您可能感兴趣的产品

您可能感兴趣的产品