分布式云原生 UCS

统一算力调度

覆盖华为云、多云、边缘云、客户IDC等场景,基于CPU、内存、流量等多种弹性策略可选择

统一流量治理

东西/南北流量全域统一治理 拥有流量切分、灰度、故障倒换等丰富的治理策略

统一配置管理

基于Gitops提供原生Kubernetes、Helm Chart、Kustomize等资源交付清单的版本管理

统一智能运维

7*24h健康守护,全域监控、智能巡检 提供运维标准接口,支持对接到第三方监控日志运维系统

统一应用生态

150+应用生态开箱即用 一次上架全域分发,跨云一键部署

连接并管理任何地域、任何基础设施上的Kubernetes集群

连接并管理任何地域、任何基础设施上的Kubernetes集群

集群类型

华为云集群

UCS(Huawei Cloud)

伙伴云集群

UCS(Partner Cloud)

本地集群

UCS(On-Premises)

附着集群

UCS(Attached clusters)
简介

包括华为云CCE Standard集群CCE Turbo集群

包括伙伴云的CCE Standard集群和CCE Turbo集群

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群,支持离线场景

满足CNCF标准的第三方Kubernetes集群,如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

集群资源由华为云全托管,简化业务上云流程

集群资源由伙伴云全托管

由华为云提供,支持本地化部署,可实现华为云与您的数据中心资源相互协同

部署在其他云厂商或本地自建的kubernetes集群

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划;拥有本地自建的kubernetes集群,希望业务在波峰期能快速弹性上云

已有业务部署在伙伴云集群,期望通过多云平台,对业务混合部署以提升应用的可靠性

拥有自建的数据中心(IDC);对数据安全和可靠性存在强诉求的金融、证券等行业;需构建灵活弹性的AI基础设施,加速AI训练和推理

已有业务部署在其他云厂商或者自建的kubernetes集群中,期望通过多云平台,对业务混合部署以提升应用的可靠性

华为云集群

UCS(Huawei Cloud)
简介

包括华为云CCE Standard集群CCE Turbo集群

部署形态

集群资源由华为云全托管,简化业务上云流程

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划;拥有本地自建的kubernetes集群,希望业务在波峰期能快速弹性上云

伙伴云集群

UCS(Partner Cloud)
简介

包括伙伴云的CCE Standard集群和CCE Turbo集群

部署形态

集群资源由伙伴云全托管

适用场景

已有业务部署在伙伴云集群,期望通过多云平台,对业务混合部署以提升应用的可靠性

本地集群

UCS(On-Premises)
简介

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群,支持离线场景

部署形态

由华为云提供,支持本地化部署,可实现华为云与您的数据中心资源相互协同

适用场景

拥有自建的数据中心(IDC);对数据安全和可靠性存在强诉求的金融、证券等行业;需构建灵活弹性的AI基础设施,加速AI训练和推理

附着集群

UCS(Attached clusters)
简介

满足CNCF标准的第三方Kubernetes集群,如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

部署在其他云厂商或本地自建的kubernetes集群

适用场景

已有业务部署在其他云厂商或者自建的kubernetes集群中,期望通过多云平台,对业务混合部署以提升应用的可靠性

为什么选择华为云UCS服务

提升管理效率,跨云、跨地域集群统一管理

提升管理效率,跨云、跨地域集群统一管理

  • 统一集群接入:支持公网/VPN/专线多种接入方式

  • 统一资源视图:多集群统一视图,提供全局集群资源和应用分布大屏

  • 统一权限管理:提供一致性权限管理所有集群,支持企业项目的租户用户权限管理

华为云与本地IDC协同,实现弹性上云

华为云与本地IDC协同,实现弹性上云

  • 构筑本地集群急速弹性上云,流量高峰,业务云上秒级扩容

  • 结合Volcano以及HCE OS 2.0能力,构建本地集群在线、离线混部能力,资源利用率提升40%

  • 在AI训练和AI推理场景下,通过GPU虚拟化技术实现GPU隔离以及资源利用率提升

云原生应用全景观测,大幅提升运维效率

云原生应用全景观测,大幅提升运维效率

  • 全景可观测,全域集群运维统一视图

  • 全域集群智能巡检,自动化实现集群健康守护

  • 提供运维系统标准接口,通过REST API、Exporter等方式快速对接到第三方监控日志运维系统

多集群管理基石——Karmada

多集群管理基石——Karmada

  • 跨集群调度策略:支持ClusterName、Label、Taints和Tolerations、集群拓扑等多种调度策略

  • 跨集群故障迁移:集群发生故障后,将故障集群实例进行自动调度到健康集群

  • 跨集群弹性伸缩:应用可根据不同集群权重进行实例分配

  • 跨集群流量分发:可以根据权重、优先级、自动均衡等多种配置实现

丰富的云原生服务生态

丰富的云原生服务生态

  • 提供100+开源应用、10+精选开源、20+商业应用

  • 支持用户订阅云原生服务,一键分发到UCS接入的集群及边缘节点

安全可靠,多云多集群安全策略统一管控

安全可靠,多云多集群安全策略统一管控

  • 利用OPA机制,统一管理个集群的安全策略的资源访问限制,便于多云多集群的合规性审计

  • 提供内置策略以及自定义策略,用于管理集群资源的安全合规性

丰富的应用场景,快速实现业务部署

全域管理
方案概述

为集团型企业打造全域一朵云,实现跨云跨地域kubernetes集群的统一管理、统一运维、统一配置和统一生态,建设简约高效的云原生数字化平台

业务痛点
管理效率低

集团型企业通常在各地设置分支机构,基础设施复杂;分布在全国甚至全球的业务各自独立看护,人力成本高、管理效率低

故障响应慢

缺乏全局统一的洞察分析工具,故障感知能力弱,故障响应周期长

缺少轻量化云化方案

无法利旧已有的硬件和虚拟化环境,保护已有的投资

方案价值
1.对集团分支机构统一管理,有效提升管理效率,并促进集团内部资源整合
2.轻量化部署 UCS(On-Premises) 服务, 基于三台物理机/虚拟机即可构建云原生容器平台
3.全栈云原生加持,业务开发测试更加敏捷、交付运维更加便利、弹性伸缩更加迅速
分布式应用开发
方案概述

通过企业级容器云平台,我们将提供一种高效、安全的云原生解决方案,助力金融客户实现业务的灵活部署和快速响应。这一平台将支持自动化运维、高可用性和弹性扩展,确保金融业务的稳定性和数据的安全性,最终推动业务的创新和发展。

业务痛点
突发的海量交易

互联网业务的增长使得网上交易峰值难以预测,需要信息科技系统支持快速弹性扩展,以应对突发的海量交易需求

应用开发迭代周期长

金融应用的快速开发和迭代需要信息科技系统支持分布式开发,确保符合银行的IT技术规划和研发管理要求

国产化替代

响应信创要求,从数据处理到客户服务,都将更多地依赖于国产信息技术,减少对外部技术的依赖,从而增强整个金融系统的安全性和稳定性

方案价值
1.基于FinOps理念,提供集群混合部署、资源超分、应用智能弹性和资源动态扩缩容,构建云原生全栈资源效能管理平台
2.以应用为中心,支持建设微服务化,容器化、可动态编排调度的高弹性云原生技术架构
3.提供华为HCE OS,兼容麒麟、统信等信创OS以及鲲鹏、飞腾、海光等信创芯片
AI计算
方案概述

基于UCS云服务,构建了一个灵活且弹性的AI容器基础设施,以充分释放AI大模型的算力潜能。通过HCE OS性能调优、volcano调度器加持和GPU虚拟化技术,为客户提供了一个高效、可扩展的计算平台,专门优化用于AI模型的训练和推理,助力企业高效实现AI大模型的部署和运行,推动智能应用的创新和发展。

业务痛点
GPU资源利用率低

AI训练和推理场景,往往不能将GPU资源充分利用,无法做到GPU资源精细管理,导致算力资源严重浪费

训练调度难,容易出现死锁

单机多卡训练往往满足不了算力需求,因此计算密集型模型通常使用分布式训练。这种情况下,训练任务可能涉及数百个ps和worker,常出现忙等和死锁问题,需要优化拓扑调度以提高效率

方案价值
1.基于HCE OS性能调优,应用性能可提升10%~30%
2.通过volcano调度器提供的Gang Scheduling、IO aware scheduling等调度算法,解决了分布式训练的忙等、死锁和IO通信密集等问题,性能提升30%
3.华为自研的GPU虚拟化技术,实现算力和显存强隔离,使得GPU资源利用率提升20%
现代化应用交付
方案概述

基于华为云CodeArts提供可视化、可定制的持续交付流水线服务,实现缩短交付周期和提升交付质量的效果;基于GitOps引擎,提供发布回滚和版本迭代控制,实现应用的持续部署,实现多集群的GitOps持续交付,满足应用的高可用部署、系统组件多集群分发。从一周上线提升到一天上线,全周期加速多云现代化应用交付和运维。

业务痛点
多集群场景应用交付复杂

在多集群场景下,应用程序的部署变得复杂,因为它们可能会被放置在各种不同类型的集群中,比如公有云、本地环境或边缘环境,而每种环境的配置也可能不同。这种多样化的部署方式增加了管理和交付的难度

多集群场景应用运维复杂

在多集群环境中,运维管理变得非常复杂。由于集群分布在不同的地方,缺乏统一的管理和监控中心,难以提前发现和应对集群和工作负载的潜在风险。这使得在实际运行中,风险变得更加难以控制

方案价值
1.生态开放,配合华为云CodeArts实现开箱即用的流水线解决方案
2.基于GitOps,提供可审计、可持续的部署能力
3.多集群业务全景可观测,风险提前感知
服务网格
方案概述

服务网格提供非侵入式的微服务治理解决方案,支持完整的生命周期管理和流量治理,兼容Kubernetes和Istio生态,其功能包括负载均衡、熔断、限流等多种治理能力。内置灰度发布流程,提供一站式自动化的发布管理。基于无侵入的监控数据采集,提供实时流量拓扑、调用链等服务性能监控和运行诊断,构建全景的服务运行视图。

业务痛点
核心业务SLA要求高

核心业务系统对服务水平协议(SLA)的要求通常需要达到99.99%以上。这意味着系统必须在多个集群、多个可用区(AZ)、甚至多个区域或云平台上部署,以提高业务的可靠性。同时,采用亲和访问和故障切换技术来增强系统对流量的承受能力和稳定性

应用新版本上线切换风险高

应用程序在更新新版本时,面临的最大挑战是从测试阶段平稳过渡到生产环境,同时确保系统持续提供服务。如果直接将新版本发布给所有用户,一旦出现问题或BUG,就会对用户造成很大影响

方案价值
1.根据配置的服务流量分发策略,故障自动倒换,韧性增强
2.业务灰度发布,支持快速试错上线
3.提供精细化的流量管理,按照权重或者流量内容进行流量切分到不同的后端服务器
多活容灾
方案概述

为了构建高可用的云应用系统,我们采用多活容灾方案,通过在多个云平台同时运行应用来提高可靠性。这种架构包括跨云负载均衡、实时数据同步和自动化故障切换,确保系统在任何单点故障时仍能持续运行。尽管实施复杂,但它显著提升了系统的稳定性和容错能力。

业务痛点
单点故障风险

如果应用仅在单一数据中心或者云平台上运行,一旦发生故障,整个系统可能会中断,导致业务停摆和客户体验受损

灾难恢复时间长

在单一环境中发生灾难时,恢复时间可能较长,业务恢复的效率和速度无法满足高可用性的要求

资源利用不均衡

单一云平台或数据中心的资源可能出现瓶颈,通过多云和多数据中心的部署,可以优化资源利用,提高性能和扩展性

方案价值
1.提高业务系统的高可用性,减少单点故障导致的服务中断
2.通过跨云负载均衡和数据同步,能够更好地分配资源和优化性能,提供更低的延迟和更快的响应时间,提升用户体验
3.使用多个云服务提供商或数据中心可降低对单一供应商的依赖,减少因供应商问题导致的风险

携手客户持续业务创新

客户案例

即刻开启
您的

分布式云原生

之旅
购买

您可能感兴趣的产品

您可能感兴趣的产品