分布式云原生 UCS

专家咨询

分布式云原生 UCS

业界首个分布式云原生产品，为企业构建云原生业务部署、管理、应用生态的全域一致性体验，实现客户在使用云原生应用时，感受不到地域、跨云、流量的限制

统一算力调度

覆盖华为云、多云、边缘云、客户IDC等场景，基于CPU、内存、流量等多种弹性策略可选择

统一配置管理

基于 GitOps 实现 Kubernetes 原生资源的声明式版本管理与自动化交付

统一智能运维

7*24h健康守护，全域监控、智能巡检提供运维标准接口，支持对接到第三方监控日志运维系统

连接并管理任何地域、任何基础设施上的Kubernetes集群

集群类型

华为云集群

UCS(Huawei Cloud)

本地集群

UCS(On-Premises)

多云集群

UCS(Multi-cloud clusters)

附着集群

UCS(Attached clusters)

简介

包括华为云CCE Standard集群和CCE Turbo集群

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群，支持离线场景

由UCS提供的运行在第三方云服务供应商(如AWS)基础设施之上的Kubernetes集群

满足CNCF标准的第三方Kubernetes集群，如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署形态

集群资源由华为云全托管，简化业务上云流程

由华为云提供，支持本地化部署，可实现华为云与您的数据中心资源相互协同

由华为云提供，支持在AWS等第三方服务供应商的基础设施上自动化构建

部署在第三方云厂商或本地自建的Kubernetes集群

适用场景

已有业务部署在华为云集群或者有业务迁移上云的规划；拥有本地自建的Kubernetes集群，希望业务在波峰期能快速弹性上云

拥有自建的数据中心（IDC）；对数据安全和可靠性存在强诉求的金融、证券等行业；需构建灵活弹性的AI基础设施，加速AI训练和推理

拥有第三方云服务供应商基础设施资源，希望通过华为云UCS做统一的多云管理入口，将应用部署到多个云中

已有业务部署在其他云厂商或者自建的Kubernetes集群中，期望通过多云平台，对业务混合部署以提升应用的可靠性

开始注册

注册集群

华为云集群

UCS(Huawei Cloud)

包括华为云CCE Standard集群和CCE Turbo集群

集群资源由华为云全托管，简化业务上云流程

已有业务部署在华为云集群或者有业务迁移上云的规划；拥有本地自建的Kubernetes集群，希望业务在波峰期能快速弹性上云

注册集群

本地集群

UCS(On-Premises)

由UCS提供的运行在您的数据中心基础设施之上的Kubernetes集群，支持离线场景

由华为云提供，支持本地化部署，可实现华为云与您的数据中心资源相互协同

拥有自建的数据中心（IDC）；对数据安全和可靠性存在强诉求的金融、证券等行业；需构建灵活弹性的AI基础设施，加速AI训练和推理

注册集群

多云集群

UCS(Multi-cloud clusters)

由UCS提供的运行在第三方云服务供应商(如AWS)基础设施之上的Kubernetes集群

由华为云提供，支持在AWS等第三方服务供应商的基础设施上自动化构建

拥有第三方云服务供应商基础设施资源，希望通过华为云UCS做统一的多云管理入口，将应用部署到多个云中

注册集群

附着集群

UCS(Attached clusters)

满足CNCF标准的第三方Kubernetes集群，如亚马逊云EKS、谷歌云GKE、OpenShift等三方集群

部署在第三方云厂商或本地自建的Kubernetes集群

已有业务部署在其他云厂商或者自建的Kubernetes集群中，期望通过多云平台，对业务混合部署以提升应用的可靠性

注册集群

为什么选择华为云UCS服务

提升管理效率，跨云、跨地域集群统一管理

统一集群接入：支持公网/VPN/专线多种接入方式
统一资源视图：多集群统一视图，提供全局集群资源和应用分布大屏
统一权限管理：提供一致性权限管理所有集群，支持企业级的用户权限管理

华为云与本地IDC协同，实现弹性上云

构筑本地集群极速弹性上云，流量高峰，业务云上秒级扩容
结合Volcano以及HCE OS 2.0能力，构建本地集群在线、离线混部能力，资源利用率提升40%
在AI训练和AI推理场景下，通过GPU虚拟化技术实现GPU隔离以及资源利用率提升

云原生应用全景观测，大幅提升运维效率

全景可观测，全域集群运维统一视图
全域集群智能巡检，自动化实现集群健康守护
提供运维系统标准接口，通过REST API、Exporter等方式快速对接到第三方监控日志运维系统

多集群管理基石——Karmada

跨集群调度策略：支持ClusterName、Label、Taints和Tolerations、集群拓扑等多种调度策略
跨集群故障迁移：集群发生故障后，将故障集群实例进行自动调度到健康集群
跨集群弹性伸缩：应用可根据不同集群权重进行实例分配
跨集群流量分发：可以根据权重、优先级、自动均衡等多种配置实现

全域管理

方案概述

为集团型企业打造全域一朵云，实现跨云跨地域Kubernetes集群的统一管理、统一运维、统一配置和统一生态，建设简约高效的云原生数字化平台。

业务痛点

管理效率低

集团型企业在各地设立分支机构，基础设施复杂，导致管理效率低下和人力成本增加

故障响应慢

缺乏全局统一的洞察分析工具，故障感知能力弱，故障响应周期长

缺少轻量化云化方案

无法充分利用现有的硬件和虚拟化环境，保护已有的投资

方案价值

1.对集团分支机构统一管理，有效提升管理效率

2.全栈云原生加持，业务开发测试更加敏捷、交付运维更加便利、弹性伸缩更加迅速

3.轻量化部署本地集群服务，只需三台物理机或虚拟机即可构建云原生容器平台

AI计算

方案概述

基于UCS云服务，打造了灵活弹性的AI容器基础设施，通过HCE OS调优、volcano调度器和GPU虚拟化，为客户提供高效可扩展的计算平台，优化AI模型训练和推理，助力企业快速部署AI大模型，加速智能应用创新。

业务痛点

GPU资源利用率低

AI训练和推理场景，往往不能将GPU资源充分利用，无法做到GPU资源精细管理，导致算力资源严重浪费

训练调度难，容易出现死锁

计算密集型模型通常采用分布式训练，但训练过程易出现忙等和死锁问题，需要优化调度来提升效率

方案价值

1.华为自研的GPU虚拟化技术，实现算力和显存强隔离，使得GPU资源利用率提升20%

2.通过volcano调度器提供的Gang Scheduling、IO aware scheduling等调度算法，解决了分布式训练的忙等、死锁和IO通信密集等问题

现代化应用交付

方案概述

华为云 CodeArts 提供可视化、可定制的持续交付流水线服务，结合 GitOps的发布回滚和版本迭代控制，将交付周期从一周缩短至一天，显著加速了多云环境下的应用交付与运维。

业务痛点

多集群场景应用交付复杂

在多集群场景下，应用程序需在公有云、本地或边缘等配置各异的环境中部署，导致交付和管理变得更加复杂且具有挑战性

多集群场景应用运维复杂

多集群环境下，由于缺乏统一管理和监控，运维难度加大，风险难以及时发现和控制

方案价值

1.生态开放，配合华为云CodeArts实现开箱即用的流水线解决方案

2.基于GitOps，提供可审计、可持续的部署能力

3.多集群业务全景可观测，风险提前感知

多活容灾

方案概述

为构建高可用的云应用系统，我们采用多活容灾方案，通过在多个云平台同时运行应用来提高可靠性。该架构包括跨云负载均衡、实时数据同步和自动故障切换，确保系统在任何单点故障时仍能持续运行，从而显著提升了系统的稳定性和容错能力。

业务痛点

单点故障风险

如果应用仅在单一数据中心或者云平台上运行，一旦发生故障，整个系统可能会中断，导致业务停摆和客户体验受损

灾难恢复时间长

在单一环境中发生灾难时，恢复时间可能较长

资源利用不均衡

由于业务流量波动和配置不当，导致部分节点资源消耗过高而其他节点闲置的现象

方案价值

1.提高业务系统的高可用性，减少单点故障导致的服务中断

2.通过跨云负载均衡和数据同步，能够更好地分配资源和优化性能

3.使用多个云服务提供商或数据中心可降低对单一供应商的依赖

文档与学习成长

新手入门

新手入门

什么是分布式云原生UCS?

容器舰队

快速添加附着集群

查看更多
最佳实践

最佳实践

IAM用户配置权限实践

多云集群应用多活容灾

多云集群应用故障倒换

查看更多
常见问题

常见问题

UCS如何定价/收费？

如何配置UCS控制台各功能的访问权限？

附着集群接入失败怎么办？

查看更多

即刻开启
您的

分布式云原生

之旅

购买

您可能感兴趣的产品

云容器实例 CCI

基于Kubernetes的Serverless容器服务

云容器引擎 CCE

提供高可靠的企业级容器应用管理服务

容器镜像服务 SWR

支持容器镜像全生命周期管理的服务

分布式云原生 UCS