搜索_华为云

概述 - 云架构中心
概述 - 云架构中心

复能力监控告警应用系统故障后的检测和告警能力弹性扩缩容应用容量不足时的自动恢复能力变更防差错变更对应用业务中断的影响应急恢复处理应用在故障情况下的应急恢复能力父主题：参考架构

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
内部工具或公测类应用典型部署架构（99%） - 云架构中心

不方便，可以承受长时间的恢复时间和恢复点；公测类应用用于面向客户的实验性的工作负载，在必要时可以隐藏其功能；针对这些应用，其可用性目标通常要求不高，可达到99%，即每年中断时间可以为3.65天。导致业务中断的时间包含故障中断时间及由于升级配置维护等导致的中断时间，假定分别中断时间如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
单Region方案 - 云架构中心
单Region方案 - 云架构中心

数据层：每个可用区各部署一套RDS数据库，通过DRS数据复制服务实现跨AZ的双向数据库复制与容灾切换；并支持定期自动数据备份，在数据丢失时能快速恢复。OBS对象存储跨可用区高可用部署，单个AZ故障对业务没有影响。为了保证数据的可靠性，RDS数据库的数据定期自动备份。父主题：电商类应用典型部署架构（99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
双Region方案 - 云架构中心
双Region方案 - 云架构中心

a、RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS for MySQL，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常作为专项开展。容灾演练可以帮助企业更好的验证RPO、RTO指标，及时发现

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
资源编排服务(RFS) - 云架构中心

Provider）的新一代云服务资源终态编排引擎，在应用编排服务(AOS)基础上实现了生态、体验、特性的全新升级；资源编排服务基于业界开放生态HCL语法模板，实现云服务资源的自动化批量构建，帮助用户高效、安全、一致创建、管理和升级云服务资源，能有效提升资源管理效率，并降低资源管理变更带来的安全风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
COST05-01 分析业务趋势和优化收益 - 云架构中心

的应用。优化时要考虑的另一个因素是实施更改的工作量。如果测试和验证变更的成本很高，优化的频率应该降低。您应该反方向考虑是否可以通过替身自动化测试和验证能力，从而进一步降低人力成本。此外，由于成本优化带来可能带来的资源冗余度的下降，故而也应该综合考虑业务的趋势。比如一个快速增长的业务组织更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
RES07-01 定义关键指标与阈值并监控 - 云架构中心

对资源进行监控时，需要先定义资源的关键指标以及对应的阈值，以便快速有效的发现业务表现和系统状态，以便在异常状态下尽早干预恢复，或定位改进系统缺陷。风险等级中关键策略关键指标需要与系统内工作负载的关键性能指标相关，并能确定为系统性能下降的早期警告信号，如系统处理的API数量及成功率，相

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：降低了运维成本与难度：降低了运维多套系统的难度，减少了客户运维起步的资源投入，降低了运维成本运营分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
COST02-02 精细化预算管理和跟踪 - 云架构中心

个项目/业务/应用全生命周期的云开销。企业的项目/业务是随时间变化而变化的，一般而言，新兴业务/项目常有更多云资源扩容的需求，而稳定的业务/项目则可以更多考虑单位收益的云成本是否可以持续优化，而处于生命周期末尾的项目/业务则需要考虑逐步释放不再需要的资源。企业制定预算时，应该

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST02 实施预算规划管理机制
SEC06-01 安全合规使用开源软件 - 云架构中心

品或企业的声誉受损。归一化管理。企业应进行开源软件归一化管理，对开源软件的引入进行归一，建立优选库、路标库，减少开源的种类和数量。牵引团队使用优选的开源软件，保障使用质量和安全。降低开源漏洞的影响。开源软件的安全漏洞传播快，影响大。一旦出现安全漏洞，快速排查受影响的产品并进行修复是降低影响的关键。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
SEC02-04 一体化身份管理 - 云架构中心

统一身份管理系统与公司的HR流程结合，当员工入职、调岗和离职时可以触发用户的创建、变更和删除。针对Landing Zone搭建的云上多账号环境，利用IAM身份中心集中管理多个账号的用户身份，并集中为这些用户配置能够访问多个账号下云资源的权限，无需在每个账号的IAM系统分别创建IA

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

LB实现ECS实例的故障检测与负载均衡，并可根据ECS监控情况随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS，可根据RDS负载监控情况，在维护时段更改实例类型或增加只读节点。变更防差错软件更新采用离线更新，在位替换，根据runbook进行应用的自动部署与回滚。每1~2个月更新一次软件。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

配合弹性负载均衡ELB服务，可以实现多BMS实例的负载均衡。健康检查通过弹性负载均衡ELB服务，可对BMS实例进行健康检查。详见“修改健康检查配置”。跨AZ容灾配合ELB服务，可以实现跨AZ的故障切换。监控告警配合CES服务，支持对BMS的CPU、内存、磁盘、网络等进行监控和告警。详见“监控指标说明”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
RES13-01 采用自动弹性扩缩容 - 云架构中心

弹性扩缩容需要通过业务处理逻辑与数据分离、状态外置等技术手段支撑系统处理能力的快速增加或减少。系统扩容和缩容的处理方式有两种，一种是改变单机的处理能力，包括CPU、内存、存储等，称之为纵向伸缩；另一种是单机节点处理能力不变，通过增加节点的数量来改变系统的处理能力，称之为横向伸缩。系统设计时一般建议采用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

DCS服务提供主备、Proxy集群、Cluster集群实例，通过节点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到OBS中，以便在缓存实例发生异常后能够从备份数据进行恢复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

本来完成容灾架构部署。应用系统可设计为使用分布在多个可用区中的资源池，并利用云服务实例本身具备或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01 集群跨AZ部署 RES03-02 跨AZ数据同步

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

识别标签缺失和错误：在确定需要进行标签治理后，需要首先识别所有未打标签的资源和标签key&value错误的资源，然后从费用最高的资源开始逐步治理。建议利用云厂商提供的工具或者自建工具，通过自动化规则的方式，在资源创建的时候，就判断标签是否规范。另外一个更好的方式通过权限管理，识别资源创建人和组织，自动为资源打上标签。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

弹性云服务器所在的硬件出现故障时，系统会自动将弹性云服务器迁移至正常的物理机，保障业务受到的影响最小，该过程会导致云服务器重启。详见“物理机故障时，弹性云服务器是否会自动恢复”。当检测到弹性云服务所在的硬件出现亚健康时，系统会自动化将弹性云服务器热迁移到其他物理服务器上继续运行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器

总条数： 141

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - 云架构中心

内部工具或公测类应用典型部署架构（99%） - 云架构中心

单Region方案 - 云架构中心

双Region方案 - 云架构中心

RES11-04 灾难演练 - 云架构中心

资源编排服务(RFS) - 云架构中心

COST05-01 分析业务趋势和优化收益 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

COST02-02 精细化预算管理和跟踪 - 云架构中心

SEC06-01 安全合规使用开源软件 - 云架构中心

常见故障模式 - 云架构中心

SEC02-04 一体化身份管理 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

可靠性功能 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

可靠性功能 - 云架构中心

RES03 跨AZ容灾 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

可靠性功能 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线