搜索_华为云

可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

串联模型：组成系统的所有单元中任一单元的故障都会导致整个系统故障的称为串联系统。可靠性数学模型：举例：假定系统存在2个串联单元，每个单元的可用度均为99.9%，则系统可用度为 Rs = 99.9% * 99.9% = 99.8%。串联系统中系统可用度低于串联系统中任一单元的可用度。为提高系统可用度，设计时需考虑：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
信息管理类应用典型部署架构（99.95%） - 云架构中心

10分钟，则每年故障中断时长为120分钟。变更中断：假定应用支持离线更新与在线补丁，每年离线更新4次，每次更新时长30分钟，则每年更新时长为120分钟；在线补丁不影响业务。按照以上评估，每年应用系统不可用的时长是240分钟，满足可用设计目标要求。信息管理类应用典型架构为前端

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
安全性云服务介绍 - 云架构中心

漏洞管理服务 CodeArts Inspector：面向软件研发和服务运维提供的一站式漏洞管理能力，通过实时持续评估系统和应用等资产，内置风险量化管理和在线风险分析处置能力，帮助组织快速感知和响应漏洞，并及时有效地完成漏洞修复工作，更好地应对潜在的安全威胁。数据安全数据安全中心

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
单Region方案 - 云架构中心
单Region方案 - 云架构中心

题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库的分层部署架构。该应用系统在华为云一个Region两个AZ中各部署一套，提供同城容灾能力。接入层（外部GSLB）：通过外部GSLB进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

ECS实例或挂载的磁盘或数据被意外删除检测：NA 恢复：对于无状态业务，使用模板快速发放新实例；对于有状态业务，使用CBR云备份服务对ECS进行定期备份，在数据被删除时使用备份数据快速恢复。 ECS实例使用本地盘时本地盘故障检测：应用层检测本地盘运行状态。恢复：应用层采用RA

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库/虚拟机的分层部署架构。应用系统在IDC/其他云与华为云中各部署一套完整系统；华为云采用跨AZ部署，可以实现云内应用层跨数据中心双活；云间数据支持将它云数据实时同

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
PERF04-05 应用性能数据采集 - 云架构中心

应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有： APM 工具：可用使用云上APM 工具或者开源的APM工具和分析性能数据（指标、日志、调研链）

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
OPS03-05 进行混沌测试和演练 - 云架构中心

Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA Kafka实例通过副本冗余方式实现实例容灾，当检测到leader副本故障后，快速完成副本选主，保障Kafka实例持续提供服务。 RabbitMQ集群提供镜像队列，通过镜像在其他节点同步数据。单节点宕机时，仍可通过唯一的访问地址对外提供服务。 RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

RES13 过载保护当系统流量超过一定阈值后，导致系统处于过载状态时，可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
SEC01-05 实施威胁建模分析 - 云架构中心

实施威胁建模分析威胁建模是一种系统性的方法，用于识别和评估可能对系统或组织造成威胁的潜在威胁源、攻击路径和攻击手段。通过识别威胁理解系统的安全风险，发现系统设计中的安全问题，制定消减措施，降低系统风险，提升系统安全性和韧性。风险等级高关键策略以下是系统运行期间的威胁模型：该模型中涉及的概念如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

电子传输及完整设备支持：少量数据丢失，备用数据系统就绪，数据定时传送，备用网络就绪数小时至2天数小时至1天 5 实时数据传输及完整设备支持：数据丢失趋于0，备用数据系统就绪，远程数据复制，备用网络就绪数分钟至2天 0至30分钟 6 数据零丢失和远程集群支持：数据零丢失，自动系统故障切换，远程磁盘镜像，备用网络active

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
OPS06-06 实施分布式跟踪 - 云架构中心

编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时，标识符将被添加

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行过载保护，保障优先业务的运行。 OBS对象上传/下载失败检测：对象上传/下载失败。恢复：应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。当OBS桶由于过载导致网络限制时，可参考“OBS桶流量过载”的处理。 OBS桶内数据被误删检测：NA 恢复：针对OBS桶启用多

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
可用性需求 - 云架构中心
可用性需求 - 云架构中心

根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的可用性目标明

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

移能力。当弹性云服务器所在的硬件出现故障时，系统会自动将弹性云服务器迁移至正常的物理机，保障业务受到的影响最小，该过程会导致云服务器重启。详见“物理机故障时，弹性云服务器是否会自动恢复”。当检测到弹性云服务所在的硬件出现亚健康时，系统会自动化将弹性云服务器热迁移到其他物理服务器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器

总条数： 206

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可用度及SLO - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

安全性云服务介绍 - 云架构中心

单Region方案 - 云架构中心

常见故障模式 - 云架构中心

跨云容灾方案 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

可靠性功能 - 云架构中心

RES13 过载保护 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

SEC01-05 实施威胁建模分析 - 云架构中心

RTO与RPO - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

可用性需求 - 云架构中心

可靠性功能 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线