搜索_华为云

可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

串联模型：组成系统的所有单元中任一单元的故障都会导致整个系统故障的称为串联系统。可靠性数学模型：举例：假定系统存在2个串联单元，每个单元的可用度均为99.9%，则系统可用度为 Rs = 99.9% * 99.9% = 99.8%。串联系统中系统可用度低于串联系统中任一单元的可用度。为提高系统可用度，设计时需考虑：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
概述 - 云架构中心
概述 - 云架构中心

概述本章节介绍常用云服务的可靠性功能与故障模式，以便应用系统能充分利用云服务提供的可靠性能力，提升应用系统的可靠性，并能针对云服务的常见故障模式，进行故障恢复处理，以便最大限度减少故障，并能从故障中恢复。父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES06-01 故障模式分析 - 云架构中心

严酷度是度量故障给系统造成的最坏潜在后果，一般分为四个等级：Ⅰ类（严重）、Ⅱ类（较严重）、Ⅲ类（一般）、Ⅳ类（轻微）。 I类：这种故障会导致整个系统崩溃或主要功能受到严重影响； II类：这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患； III类：系统次要功能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

以下章节我们结合一些具体建议和案例来说明如何针对缓存的使用进行性能优化。 Redis使用规范如下的规范可以帮助我们在系统运行过程中，尽可能减少遇到redis不稳定或异常的概率，保证系统的长稳运行。业务使用规范原则原则说明级别备注就近部署业务，避免时延过大如果部署位置过远（非同

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
SEC06-04 应用安全配置 - 云架构中心

e、Jetty、JBoss、PHP、Redis等完成安全配置加固和Web攻击防护。系统越权，例如系统是否存在capability提权、suid文件提权、定时任务提权、sudo文件配置提权等系统提权问题。服务运行用户，例如服务运行的用户是否为最低权限用户，禁止使用root用户运行服务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
PERF05-04 大数据场景资源优化 - 云架构中心

大数据场景资源优化风险等级中关键策略在大数据场景下，可以通过优化资源的使用和分配，提高系统的性能和效率。以下是一些常见的大数据场景资源优化方法：分布式存储：使用分布式存储系统，如Hadoop HDFS、Apache Cassandra等，将数据分散存储在多个节点上，以提高数据的可靠性和可扩展性。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

RES11-04 灾难演练通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES07-03 监控到异常后发送消息通知 - 云架构中心

RES07-03 监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份，避免单点风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
多活高可用(MAS) - 云架构中心
多活高可用(MAS) - 云架构中心

主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库，通过混沌实验编排攻击目标、攻击策略进行故障注入，支持添加背景流量和资源监控，同时在故障注入能力的基础上，通过体系化的流程和规范来创建故障演练，从而验证和提升系统可靠性和技术团队应急响应能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES11-02 压力负载测试 - 云架构中心

RES11-02 压力负载测试通过施加超出系统容量的业务压力，验证云服务的过载保护、业务隔离和优雅降级等能力。为全面验证系统整体的容量规划和业务依赖，云服务应用通常采用全链路压测进行测试。风险等级高关键策略模拟大量接口消息进行压力测试。模拟各种业务场景进行压力测试。持续自动测试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
SEC05-05 证书安全管理 - 云架构中心

SEC05-05 证书安全管理证书的常见用途包括传输数据的加密和系统间的身份认证场景。集中管理每个证书的用途、有效期等信息，并及时对证书替换。风险等级中关键策略集中管理证书：建立中心化的证书管理系统，用于存储、跟踪和管理所有证书。确保每个证书都有清晰的标识，包括用途、所有者、有效期等信息。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。演练期

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
SEC09-04 安全态势感知 - 云架构中心

SEC09-04 安全态势感知跟踪并监控对网络资源和关键数据的所有访问：通过系统的活动记录机制和用户活动跟踪功能可有效降低恶意活动对于数据的威胁程度。当系统出现错误或安全事件时，通过执行彻底地跟踪、告警和分析，可以较快地确定导致威胁的原因。风险等级中关键策略采集各类安全

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES10-04 健康检查与自动隔离 - 云架构中心

RES10-04 健康检查与自动隔离对应用组件进行健康检查，当发现故障后进行主动隔离，避免故障扩散。风险等级高关键策略对系统内组件需要定期进行健康检查，以判断其状态是否正常。对于异常组件，需要能支持自动隔离，避免对整体业务造成影响。相关云服务和工具弹性负载均衡器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
PERF02-02 容量规划 - 云架构中心

用或服务添加到系统中，那么容量预测模型就需要考虑这些新的容量需求。预测与工作负载目标的一致性，可确保充分预配资源，防止资源浪费或工作负载过载。确定资源需求根据需求和预测分析的结果，进行容量评估和规划。确定系统所需的计算资源、存储资源和网络带宽等资源，以满足系统的性能要求。计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
RES08-01 减少强依赖项 - 云架构中心

对整体系统功能的影响减到最小。如所依赖的数据丢失时，应用程序仍能运行，但可以提供稍微陈旧的数据、替代数据，甚至没有数据，应用仍处于可预测和可恢复的状态。避免启动依赖及循环依赖。若应用系统由于某些原因导致重启时，若依赖于其他依赖项启动或加载关键配置数据，可能会导致应用系统长时间停

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
单Region方案 - 云架构中心
单Region方案 - 云架构中心

题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库的分层部署架构。该应用系统在华为云一个Region两个AZ中各部署一套，提供同城容灾能力。接入层（外部GSLB）：通过外部GSLB进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES01-01 应用组件高可用部署 - 云架构中心

业务自动恢复的功能，并能容忍虚拟机HA期间业务处理性能短暂下降或中断。对已部署的应用系统，改造为支持高可用能力的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其高可用能力，即在其故障的情况下，是否能自动故障转移，进行业务恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级

总条数： 178

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可用度及SLO - 云架构中心

概述 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

缓存性能优化 - 云架构中心

SEC06-04 应用安全配置 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

RES11-04 灾难演练 - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

多活高可用(MAS) - 云架构中心

RES11-02 压力负载测试 - 云架构中心

RES11-03 长稳测试 - 云架构中心

SEC05-05 证书安全管理 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

SEC09-04 安全态势感知 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

PERF02-02 容量规划 - 云架构中心

RES08-01 减少强依赖项 - 云架构中心

单Region方案 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线