搜索_华为云

什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

应用韧性是应用系统在运行过程中面对各种异常场景，如基础设施故障（如数据库异常）、外部攻击（如网络DDoS攻击超出预定限额流量）、外部依赖故障（如依赖系统访问超时或不可用）、地域灾难（如大面积停电、洪水）等，仍能提供和维持可接受的服务水平的能力，对系统至关重要。系统韧性设计主要涉及以下两个方面：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
PERF06-02 性能劣化自动定界定位 - 云架构中心

PERF06-02 性能劣化自动定界定位风险等级中关键策略通过建立的分层性能模型，判断系统是否会出现性能劣化的情况。当出现劣化事件时，需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

、大规模文件存储、编译构建等场景）可能会比较消耗存储的带宽。根据业务的特征选择合适的虚拟机类型和规格。具体的虚拟机类型规格请参考官方文档。相关云服务和工具弹性云服务器 ECS 裸金属服务器 BMS 父主题：选择合适的计算资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
RES10-04 健康检查与自动隔离 - 云架构中心

高关键策略对系统内组件需要定期进行健康检查，以判断其状态是否正常。对于异常组件，需要能支持自动隔离，避免对整体业务造成影响。相关云服务和工具弹性负载均衡器 ELB：支持健康检查，会定期向后端服务器发送请求以测试其运行状态，并根据健康检查来判断后端服务器是否可用，当判断为

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

），或双主灾备（详见“云数据库 TaurusDB到云数据库 TaurusDB双主灾备”）。监控告警配合CES服务，支持对云数据库 TaurusDB的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。父主题：云数据库 TaurusDB云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

tMQ实例、实例节点、实例队列进行监控和告警等进行监控和告警。详见“支持的监控指标”。 RocketMQ：配合CES服务，支持对RocketMQ实例、实例节点、实例队列、实例消费组、实例队列消费组、实例的死信队列进行监控和告警。详见“支持的监控指标”。父主题： DMS分布式消息服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
单Region方案 - 云架构中心
单Region方案 - 云架构中心

容灾应用在两个AZ各部署一套，进行双向复制，双活容灾；AZ故障时自动恢复。监控告警进行站点运行状态检查，在发生故障时告警；针对CCE、DCS、kafka、RDS、DDS等实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容 CCE集群支持工作负载的自动弹性伸缩。变更防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
SEC09-02 安全事件记录及分析 - 云架构中心

对其分析：应在关键网络节点处（例如内外网的交界处、ELB流量转发处等）检测、防止或限制网络攻击行为；应采取技术措施对采集的安全日志进行持续监控和分析，实现对网络攻击特别是新型网络攻击行为和异常行为的识别和分析。风险等级高关键策略在发生安全事件之前，可以考虑构建取证能力来支

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

n主备容灾能力的实施步骤建议如下：选择另一个Region作为灾备Region，部署一套相同的应用系统，包括工作负载、数据库实例等。针对应用系统内的关键数据，利用云服务或应用系统自身实现跨Region的数据复制。若云服务实例支持跨Region容灾，则配置生产站点与灾备Regi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
金融类核心应用典型部署架构（99.999%） - 云架构中心

定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库的分层部署架构。应用系统在两个Region各部署一套完整系统，Region内跨AZ高可用部署，提供同城跨数据中心双活能力；Region间数据单元化部署，实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 OBS桶流量过载检测：通过CES监控请求数、请求成功率、上传/下载带宽等流量指标。恢复：应用层调整批量业务，避免业务高峰期进行备份等业务；应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
故障全面检测 - 云架构中心
故障全面检测 - 云架构中心

故障全面检测高可用性系统必须具有完善的故障检测能力，以确保能够快速发现那些可能导致故障的事件、显示正在发展的故障、激活的故障，以及潜在的故障的事件。在几乎所有情况下，故障检测能力都是故障恢复的前提。 RES06 故障检测 RES07 监控告警父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例风险等级中关键策略成本是否准确有效的分配，是后续进行成本监控和优化的基础。客户应关注并提升成本分配比例，奠定成本治理的基础。标签作为一种常见的成本分配方式，可以灵活匹配组织内多种分配场景（比如产品、应用、责任人），但在实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
DMS分布式消息服务 - 云架构中心

Kafka专享实例。 RabbitMq版：完全兼容开源RabbitMQ，提供即开即用、消息特性丰富、灵活路由、高可用、监控和告警等特性，广泛应用于秒杀、流控、系统解耦等场景。 RocketMQ版：低延迟、弹性高可靠、高吞吐、动态扩展、便捷多样的消息中间件服务。可靠性功能常见故障模式

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
概念表 - 云架构中心
概念表 - 云架构中心

在传输或存储过程中没有被篡改或损坏。可用性确保系统和数据在需要时可用，防止因攻击、故障或其他原因导致系统不可用。从安全的角度，可用性可通过负载均衡、弹性计算、事件监控和告警、防暴力攻击如DDoS防护等手段来实现。可审计系统或数据处理过程能够被有效地监视、记录和审计的能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基本概念
SEC10-03 自动化响应安全事件 - 云架构中心

优先级与分级：根据事件的严重性和紧急程度，定义响应的优先级，确保重要事件得到优先处理。持续监控：利用SIEM（安全信息和事件管理）、UEBA（用户和实体行为分析）等工具，对网络、系统、应用程序和用户活动进行实时监控。智能警报：当检测到符合预定义触发条件的事件时，自动生成警报，并根据事件的优先级进行分类。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
BMS裸金属服务 - 云架构中心
BMS裸金属服务 - 云架构中心

BMS裸金属服务裸金属服务（Bare Metal Server，BMS）是一款兼具弹性云服务器和物理机性能的计算类服务，为企业提供专属的云上物理服务器，为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算性能以及数据安全。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

主备切换时，会导致连接中断，需要客户端重试。实例由于故障重启可能会导致通信中断，如ECS所在物理服务器由于硬件原因故障时，ECS重启或在其他物理服务器中自动恢复，恢复过程中与ECS的通信会中断，需要重试。实例由于过载导致无法及时响应，需要重试。 RES09-01 API及命令调用需要设计为可重试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
RES11 可靠性测试 - 云架构中心
RES11 可靠性测试 - 云架构中心

可靠性测试是为了保证系统在规定的生命周期内，达到预期的可靠性目标；与通常的功能测试不同，可靠性测试需要在业务负荷叠加故障中进行，对测试环境和能力提出了更高要求。可靠性测试和演练通过主动引入故障来充分验证软件质量的脆弱性，从而提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复

总条数： 250

上一页
1
...
4
5
6
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是应用韧性 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

单Region方案 - 云架构中心

常见故障模式 - 云架构中心

SEC09-02 安全事件记录及分析 - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

常见故障模式 - 云架构中心

故障全面检测 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

DMS分布式消息服务 - 云架构中心

概念表 - 云架构中心

SEC10-03 自动化响应安全事件 - 云架构中心

BMS裸金属服务 - 云架构中心

RES09 故障重试 - 云架构中心

RES11 可靠性测试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线