搜索_华为云

OPS06 可观测性体系 - 云架构中心

OPS06 可观测性体系 OPS06-01 建立可观测性体系 OPS06-02 定义可观测对象 OPS06-03 制定和实施可观测性指标 OPS06-04 规范化应用日志 OPS06-05 实施依赖项遥测 OPS06-06 实施分布式跟踪 OPS06-07 通过可观测性指标引入自动化措施

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
AS弹性伸缩 - 云架构中心
AS弹性伸缩 - 云架构中心

例或带宽资源，以保证业务能力；当业务需求下降时，AS自动缩减弹性云服务器（ECS）实例或带宽资源，以节约成本。AS支持自动调整弹性云服务器和带宽资源。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
OPS03 完备的测试验证体系 - 云架构中心

使用多个环境进行集成测试，构建和生产环境相同的预生产环境 OPS03-03 进行性能压测 OPS03-04 对生产环境进行拨测 OPS03-05 进行混沌测试和演练父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES07 监控告警 - 云架构中心
RES07 监控告警 - 云架构中心

RES07-01 定义关键指标与阈值并监控 RES07-02 日志统计监控 RES07-03 监控到异常后发送消息通知 RES07-04 监控数据存储和分析 RES07-05 端到端跟踪请求消息父主题：故障全面检测

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测
BMS裸金属服务 - 云架构中心
BMS裸金属服务 - 云架构中心

BMS裸金属服务裸金属服务（Bare Metal Server，BMS）是一款兼具弹性云服务器和物理机性能的计算类服务，为企业提供专属的云上物理服务器，为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算性能以及数据安全。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES14 配置防差错 - 云架构中心
RES14 配置防差错 - 云架构中心

RES14 配置防差错配置防差错是针对配置过程中因人输入了错误的配置数据导致系统和业务受损或失效场景下通过产品设计降低或避免配置错误产生的影响。 RES14-01 变更防呆检查 RES14-02 自动化变更 RES14-03 变更前数据备份 RES14-04 提供runbook进行标准化变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错
RES03-04 支持容灾管理 - 云架构中心

典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。典型亚健康故障场景，支持业务降级或主动切换，业务不持续受损。相关云服务和工具多活高可用服务 MAS 父主题： RES03 跨AZ容灾

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
云数据库 TaurusDB云数据库 - 云架构中心

数据库，完全兼容MySQL。基于华为最新一代DFV存储，采用计算存储分离架构，128TB的海量存储，故障秒级切换，既拥有商业数据库的高可用和性能，又具备开源低成本效益。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES07-02 日志统计监控 - 云架构中心

关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。相关云服务和工具云日志服务 LTS 父主题： RES07 监控告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES04-03 容灾恢复过程自动化 - 云架构中心

监控及PO指标。灾难场景下的一键式自动切换，减少人工干预，满足RPO/RTO指标。支持容灾恢复流程编排、容灾演练等功能。相关云服务和工具多活高可用服务 MAS 父主题： RES04 跨Region/跨云容灾

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES12-03 定期应急恢复演练 - 云架构中心

员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具云运维中心 COC：支持混沌演练，为用户提供一站式的自动化演练能力，覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端的演练流程。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
PERF06-02 性能劣化自动定界定位 - 云架构中心

扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层指标的聚合可视化能力，需要依赖持续的资源治理和数据治理。相关云服务和工具：优化顾问 OA 云监控服务 CES 应用运维管理 AOM 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
PERF06-01 分层看护 - 云架构中心

一般、紧急、重要三个梯度，对应每个梯度的指标配套对应的处理措施。对于敏感度或业务重要度的应用架构，可以新增一个提示级别的梯度。相关云服务和工具：云监控服务 CES 应用运维管理 AOM 应用性能管理APM 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
概述 - 云架构中心
概述 - 云架构中心

应用数据被破坏的情况下的恢复能力容灾在Region/AZ/IDC或其他云站点发生灾难的情况下的恢复能力监控告警应用系统故障后的检测和告警能力弹性扩缩容应用容量不足时的自动恢复能力变更防差错变更对应用业务中断的影响应急恢复处理应用在故障情况下的应急恢复能力父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。演练期间可检查灾难恢复计划执行顺序及恢复时间并进行优化。相关云服务和工具多活高可用服务 MAS 父主题： RES04 跨Region/跨云容灾

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES02-03 定期进行备份数据恢复 - 云架构中心

构建一个测试环境，并使用已有的备份数据进行恢复处理。华为云云服务提供了手工恢复功能，用户可定期执行恢复操作，以进行恢复测试。相关云服务和工具云备份 CBR 云数据库 RDS 分布式缓存服务 DCS 父主题： RES02 备份

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

RES09 故障重试当应用系统部署在云中，虽然云具有一定的高可用和故障自动恢复能力，但对外仍会导致短时间的故障，需要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

丢失数据量可以不同，即RPO不同；为了保证数据备份的RPO目标，需要采用定期自动备份，而不要依赖人工进行手工备份。 RES02-01 识别和备份应用中所有需要备份的关键数据 RES02-02 自动数据备份 RES02-03 定期进行备份数据恢复父主题：高可用设计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
PERF03-06 选择合适的消息队列 - 云架构中心

RabbitMQ：兼容开源RabbitMQ，支持广播、事务消息、消息路由、死信队列、优先级队列等，适用于秒杀、流控、系统解耦等场景。详细版本对比可参考官方文档。相关云服务和工具：分布式消息服务Kafka版分布式消息服务RocketMQ版分布式消息服务RabbitMQ版父主题：选择合适的应用中间件云服务资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

业务价值：降低了运维成本与难度：降低了运维多套系统的难度，减少了客户运维起步的资源投入，降低了运维成本运营分析能力提升：基于可视化图表和开箱即用的仪表盘等强大功能，快速实现对业务的运营分析排障能力提升：云端多维度监控实现对业务立体运维，结合自动告警规则达到对故障的快速感知定位处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例

总条数： 304

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS06 可观测性体系 - 云架构中心

AS弹性伸缩 - 云架构中心

OPS03 完备的测试验证体系 - 云架构中心

RES07 监控告警 - 云架构中心

BMS裸金属服务 - 云架构中心

RES14 配置防差错 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

云数据库 TaurusDB云数据库 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

PERF06-01 分层看护 - 云架构中心

概述 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

RES09 故障重试 - 云架构中心

RES02 备份 - 云架构中心

PERF03-06 选择合适的消息队列 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线