搜索_华为云

可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能负载均衡配合弹性负载均衡ELB服务，可以对弹性伸缩组创建的弹性云服务器进行负载均衡。健康检查健康检查会将异常的实例从伸缩组中移除，伸缩组会重新创建新的实例以维持伸缩组的期望实例数和当前实例数保持一致，伸缩组的健康检查方式主要包括以下两种。云服务器健康检查：是指

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA CCE集群支持3个Master节点高可用部署，确保集群的可靠性。数据备份和恢复为满足数据持久化的需求，CCE支持将云硬盘（EVS）创建的存储卷挂载到容器的某一路径下；CCE通过云硬盘EVS服务提供针对云硬盘的快照功能，当数据丢失时，可通过快照将数据完整的恢复到快照时间点。详见“快照与备份”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
人工智能性能优化 - 云架构中心

的通信优化能力，在使用NPU的场景下，支持对节点之间的通信路径根据交换机实际topo做网络路由亲和规划，进而提升节点之间的通信速度。本案例介绍如何在ModelArts Lite场景下使用ranktable路由规划完成Pytorch NPU分布式训练任务，训练任务默认使用Volcano

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA RDS服务支持HA主备高可用架构，故障秒级自动切换。数据持久性 RDS数据持久性高达99.9999999%，保证数据安全可靠，保护业务免受故障影响。数据备份和恢复 RDS支持每天自动备份数据，备份都是以压缩包的形式自动存储在对象存储服务（Object Storage

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
应用管理与运维平台(ServiceStage) - 云架构中心

Cloud微服务框架。配合微服务引擎可实现服务注册发现、配置管理和服务治理，请参考微服务开发指南。应用运维：通过日志、监控、告警支持应用运维管理。父主题：卓越运营云服务介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 OBS桶流量过载检测：通过CES监控请求数、请求成功率、上传/下载带宽等流量指标。恢复：应用层调整批量业务，避免业务高峰期进行备份等业务；应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA Kafka实例通过副本冗余方式实现实例容灾，当检测到leader副本故障后，快速完成副本选主，保障Kafka实例持续提供服务。 RabbitMQ集群提供镜像队列，通过镜像在其他节点同步数据。单节点宕机时，仍可通过唯一的访问地址对外提供服务。 RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
概述 - 云架构中心
概述 - 云架构中心

概述本章节以典型Web应用为例，介绍不同可用性目标要求下部署的典型架构示例。针对每种场景，从以下几个维度进行设计，来达成可用性目标。类别应用可用性影响冗余应用内组件的高可用能力，在应用内部分节点故障时业务自动恢复能力备份应用数据被破坏的情况下的恢复能力容灾在Re

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
RES14-02 自动化变更 - 云架构中心

RES14-02 自动化变更自动化变更是指自动化提供并管理应用程序的环境（计算、存储、网络、中间件服务等）、安装、配置，实现Infrastructure as a Code；以解决手工部署中易于出错、依赖个人能力，手工配置中变更无法跟踪、难以回滚等难题。风险等级高关键策略使用配置

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

RabbitMQ性能优化保持尽可能短的队列长度太多的消息堆积在队列中会造成内存负载过高，为了释放内存，RabbitMQ 会把消息转存到磁盘，转存过程会耗费大量时间，造成消息处理速度下降或直接阻塞生产流程。因此队列中堆积过多的消息容易对 broker 产生负面效应。除此之外，如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

维知识，包括网络配置、服务器管理、数据库维护等方面的知识。下面将介绍运维知识库系统的五个主要功能和优势。丰富的知识资源：运维知识库系统收集整理了大量的运维知识和经验，涵盖了各个领域和层次的内容。用户可以通过系统进行检索，查找到相关的知识和解决方案。不仅可以解决一些常见的问题，还

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进

总条数： 282

上一页
1
...
7
8
9
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

人工智能性能优化 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

应用管理与运维平台(ServiceStage) - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

概述 - 云架构中心

RES14-02 自动化变更 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

RabbitMQ性能优化 - 云架构中心

OPS08-03 知识管理 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线