搜索_华为云

金融类核心应用典型部署架构（99.999%） - 云架构中心

金融类核心应用典型部署架构（99.999%）金融类核心应用通常比较重要，要求非常短的恢复时间和数据丢失量，其可用性目标通常要求达到99.999%，即每年故障时间可以为5.26分钟。假定故障中断与变更中断的时长分别如下：故障中断：由于要求的故障中断时间很短，要求尽可能自动恢复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
多活高可用(MAS) - 云架构中心
多活高可用(MAS) - 云架构中心

多活高可用(MAS) 多活高可用(MAS)的混沌工程（ChaosEngineering）是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库，通过混沌实验编排攻击目标、攻击策略进行故障注入，支持添加背景流量和资源监控，同时在故障

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

RTO与RPO 灾难场景通常采用RTO和RPO目标定义：恢复时间目标RTO：指灾难发生后应用不可用的最长时间。RTO决定了应用容灾整体架构，是采用数据备份，还是冷备、温备、热备。恢复点目标RPO：指灾难发生后应用数据丢失的最大时间。RPO决定了数据备份频率或复制方式，是在线备

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
内部工具或公测类应用典型部署架构（99%） - 云架构中心

内部工具或公测类应用典型部署架构（99%）内部工具类应用通常用于内部操作，且在故障时只会对内部员工造成影响，不可用时只会带来不方便，可以承受长时间的恢复时间和恢复点；公测类应用用于面向客户的实验性的工作负载，在必要时可以隐藏其功能；针对这些应用，其可用性目标通常要求不高，可达到99%，即每年中断时间可以为3

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能负载均衡配合弹性负载均衡ELB服务，可以对弹性伸缩组创建的弹性云服务器进行负载均衡。健康检查健康检查会将异常的实例从伸缩组中移除，伸缩组会重新创建新的实例以维持伸缩组的期望实例数和当前实例数保持一致，伸缩组的健康检查方式主要包括以下两种。云服务器健康检查：是指

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式弹性伸缩失败检测：查看弹性伸缩组的弹性伸缩活动历史。恢复：根据伸缩活动失败描述信息进行修复。父主题： AS弹性伸缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
应用运维管理(AOM2.0) - 云架构中心

应用运维管理(AOM2.0) 应用运维管理（Application Operations Management，简称AOM）是云上应用的一站式立体化运维管理平台，融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源，提供应用资源统一管理、一站式可观测性分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA CCE集群支持3个Master节点高可用部署，确保集群的可靠性。数据备份和恢复为满足数据持久化的需求，CCE支持将云硬盘（EVS）创建的存储卷挂载到容器的某一路径下；CCE通过云硬盘EVS服务提供针对云硬盘的快照功能，当数据丢失时，可通过快照将数据完整的恢复到快照时间点。详见“快照与备份”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

可用度及SLO 可用性目标用于衡量应用系统的运行时间和停机时间，其表现形式为应用系统正常运行的时间占总时间（通常是一个月或一年）的百分比（如99.9%），即：可用度 = 可用时间 / 总时间 * 100% 常见的简单表达方式用“9”的数量或“9”的数量加“5”表示，如“三个9”表示“99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
OPS06-02 定义可观测对象 - 云架构中心

对接、线下自建 Prometheus 对接、业务监控、应用监控、线下 IDC 监控和线下中间件监控网络性能管理监控功能：对客户端 - 网 - 边 - 云全链路网络进行监控，帮助用户及时发现网络故障，全面掌握网络的实时状况。主要关注：应用响应时间、DNS 解析时间、TCP 建连时间、访问流量等指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS06-05 实施依赖项遥测 - 云架构中心

OPS06-05 实施依赖项遥测风险等级高关键策略依赖项遥测可以监控工作负载所依赖的外部服务和组件的运行状况及性能。提供有关与 DNS、数据库或第三方 API 等依赖项相关的可访问性、超时及其他关键事件的高价值指标采集。当对应用程序进行检测，以发布有关这些依赖项的指标、日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES03-04 支持容灾管理 - 云架构中心

RES03-04 支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

RES11-04 灾难演练通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-02 制定应急预案 - 云架构中心

RES12-02 制定应急预案针对常见问题现象，提供标准化的应急恢复指导，以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

HIVE优化概述 Hive架构 Hive提供了Hadoop的SQL能力，主要参考标准的SQL，Hive进行了部分的修改，形成了自己的特有的SQL语法HQL（Hive SQL），更加适合于Hadoop的分布式体系，该SQL目前是Hadoop体系的事实标准。 Hive调优用户输入

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
COST08-03 存算分离 - 云架构中心

COST08-03 存算分离风险等级中关键策略传统大数据方案计算和存储融合部署，扩容磁盘时必须扩容计算节点，在实际使用时产生浪费。存算分离是一种数据处理技术，它将数据存储和数据处理（计算）分开，使得存储和计算可以独立地进行优化和扩展，这种技术提高数据处理的效率、降低成本并满足大规模数据存储和分析的需求。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
RES10-03 采用Grid架构 - 云架构中心

RES10-03 采用Grid架构采用Grid架构，可将应用系统内的工作负载的故障影响限制在有限Grid业务单元中。风险等级高关键策略应用系统采用多个功能相同的Grid业务单元，每个Grid业务单元具备完整业务功能，处理整个业务负载中的一个子集，不涉及与其他Grid业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离

总条数： 381

上一页
1
...
11
12
13
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

金融类核心应用典型部署架构（99.999%） - 云架构中心

多活高可用(MAS) - 云架构中心

RTO与RPO - 云架构中心

内部工具或公测类应用典型部署架构（99%） - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

应用运维管理(AOM2.0) - 云架构中心

可靠性功能 - 云架构中心

可用度及SLO - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

OPS06-05 实施依赖项遥测 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

RES11-04 灾难演练 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

常见故障模式 - 云架构中心

HIVE优化 - 云架构中心

COST08-03 存算分离 - 云架构中心

常见故障模式 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线