搜索_华为云

COST05-01 分析业务趋势和优化收益 - 云架构中心

的应用。优化时要考虑的另一个因素是实施更改的工作量。如果测试和验证变更的成本很高，优化的频率应该降低。您应该反方向考虑是否可以通过替身自动化测试和验证能力，从而进一步降低人力成本。此外，由于成本优化带来可能带来的资源冗余度的下降，故而也应该综合考虑业务的趋势。比如一个快速增长的业务组织更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES12-02 制定应急预案 - 云架构中心

制定应急预案针对常见问题现象，提供标准化的应急恢复指导，以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。每个恢复操作动作必须明确无歧义，可指导操作人员。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
PERF04-05 应用性能数据采集 - 云架构中心

通过框架引入到代码库中，可以在运行时采集相关的性能数据。自定义检测：仅当平台指标不足时，才建议开发人员可以添加自定义代码采集独有的性能指标。使用业界可观测的标准。请考虑使用围绕业界标准构建的工具，例如OpenTelemetry。建议：使用分布式的调用链技术，可以识别多个服务和组件之

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
OPS04-02 采用持续部署模型 - 云架构中心

选择这两种模型时，部署的每个阶段之间的时间应该足够长，以便能够监控工作负载的运行状况指标。应该提供充足的部署间隔时间（即部署组之间的时间），以确保来自不同区域的用户或执行不同任务的用户有时间使用工作负载。间隔时间应以小时和天而不是分钟来衡量。每个部署组的间隔时间也应该增加，以便考虑不同的时区和使用模式。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES12-03 定期应急恢复演练 - 云架构中心

定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
OPS06-03 制定和实施可观测性指标 - 云架构中心

用，例如Prometheus、Grafana、Zabbix等，以及华为云提供的云监控服务CES。这些工具可以定期收集指标，提供可视化的指标报告，并且可以发送警报，以帮助组织及时发现问题。可参考CES的最佳实践，https://support.huaweicloud.com/be

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES06-02 面向所有故障进行检测 - 云架构中心

针对具体故障进行检测时，根据检测的类型通常可以分为资源检测、功能检测和业务检测。资源检测：云环境中一般指虚拟化后的物理硬件资源及其对应的软件资源，具体包含CPU、内存、网络和磁盘资源等。功能检测：对组成产品系统的各个内部模块对象进行检测的过程，确定模块功能是否满足设计的需求。当产品系统的功能发生故

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
SEC10-01 建立安全响应团队 - 云架构中心

安全响应专家：主导网络安全事件调查，负责对事件进行定级、通报、攻击溯源以及确定影响范围，制定应急处置措施，推动服务控制风险。攻击溯源专家：根据攻击的IOC信息进行溯源，追溯攻击者信息，攻击范围（无遗漏），攻击溯源图（攻击路径）和攻击溯源报告，确认攻击事件性质。高级分析专家：漏洞分析及复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
PERF02-02 容量规划 - 云架构中心

源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，例如需要存储大量的数据，可能需要选择分布式存储系统。网络带宽：根据预测的需求，计算所需的网络带宽，例如需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
OPS04-01 有效落地持续集成 - 云架构中心

个基线和测试来验证代码。然后，它向提交者提供有关这些测试状态的反馈。如果基线检查和测试进展顺利，集成过程将生成并暂存部署更新软件的资产。这些资产包括编译的代码和容器映像。持续集成可以通过执行以下操作更快地交付高质量的软件：针对代码运行自动化测试，以便尽早检测到重大更改。运行代码分析以确保代码标准、质量和配置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES13-03 过载检测与流量控制 - 云架构中心

相关云服务和工具华为云提供了一些内嵌流控保护的云服务，用户可直接配置使用： API网关 APIG：支持配置流控策略，用户可指定单位时间内的单个API、单个用户或单个APP的请求次数上限。微服务引擎 CSE：支持限流，用户可指定一定时间内可接受的请求次数上限。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
单Region方案 - 云架构中心
单Region方案 - 云架构中心

数据层：每个可用区各部署一套RDS数据库，通过DRS数据复制服务实现跨AZ的双向数据库复制与容灾切换；并支持定期自动数据备份，在数据丢失时能快速恢复。OBS对象存储跨可用区高可用部署，单个AZ故障对业务没有影响。为了保证数据的可靠性，RDS数据库的数据定期自动备份。父主题：电商类应用典型部署架构（99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

保存期限无限制。 DCS指定备份集恢复。恢复过程中，实例会有一段时间不能处理客户端的数据操作请求，当前数据将被删除，待恢复完成后存储原有备份数据。详见“备份与恢复说明”。跨AZ容灾 DCS提供的主备、Cluster集群、Proxy集群实例支持跨AZ容灾，当一个AZ异常时，另一

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
OPS05-02 进行变更风控 - 云架构中心

）时引发的业务中断风险及变更失败可能导致的业务受损风险。设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月变更导致对客户造成影响的事件数与总变更数的比值。计算公式：变更导致事件密度=变更导致对客户造成影响的事件数/总变更数。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
应用运维管理(AOM2.0) - 云架构中心

Management，简称AOM）是云上应用的一站式立体化运维管理平台，融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源，提供应用资源统一管理、一站式可观测性分析和自动化运维方案，帮助用户及时发现故障，全面掌握应用、资源及业务的实时运行状况，提升企业海量运维的自动化能力和效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

要求，降低管理成本。资源管理：同步并纳管用户在云平台上使用的资源实例，构筑资源运维能力底座。配置管理：提供应用和资源视角的管理能力，以及参数配置集中式看护、全生命周期管理的能力。合规性管理：资源运维提供批量的补丁扫描修复能力，安全合规先行，兼顾高效。全方位变更管理方案评

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES03-04 支持容灾管理 - 云架构中心

RES03-04 支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES07-04 监控数据存储和分析 - 云架构中心

RES07-04 监控数据存储和分析监控数据包括统计和日志信息，均需要存储并进行生命周期管理，以满足数据监控的保留要求；并定期对其进行分析，以了解系统运行状态和趋势。风险等级中关键策略监控数据存储时长需要满足保留要求。监控数据需要定期分析，以便发现或预测系统故障，减少业务中断。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警

总条数： 296

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

COST05-01 分析业务趋势和优化收益 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

SEC10-01 建立安全响应团队 - 云架构中心

PERF02-02 容量规划 - 云架构中心

OPS04-01 有效落地持续集成 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

单Region方案 - 云架构中心

可靠性功能 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

应用运维管理(AOM2.0) - 云架构中心

云运维中心(COC) - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

RES07-04 监控数据存储和分析 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线