搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
OPS07-04 支持故障恢复流程 - 云架构中心

OPS07-04 支持故障恢复流程风险等级高关键策略当现网发生故障时，既要快速恢复业务，又要降低影响，首先需要围绕故障全生命周期采取一系列控制流程，包含故障预防、故障发现、故障定位、故障恢复、故障复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
基础概念 - 云架构中心
基础概念 - 云架构中心

基础概念指标概念解读性能性能是指软件系统或软件对应其及时性要求的符合程度。及时性用响应时间或吞吐量来衡量。响应性响应性是系统实现其响应时间或吞吐量目标的能力。响应时间（RT）用户感受系统为其服务所耗费的时间。不同业务系统的响应时间期望值不同，如互联网业务多为500ms

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
SEC03-03 定期审视权限 - 云架构中心

通过IAM用户的“最近一次登录时间”，判断该用户是否为长期未登录的用户，及时管理他们的身份凭证及权限。相关云服务和工具统一身份认证服务 IAM 父主题： SEC03 权限管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
多活高可用(MAS) - 云架构中心
多活高可用(MAS) - 云架构中心

多活高可用(MAS) 多活高可用(MAS)的混沌工程（ChaosEngineering）是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库，通过混沌实验编排攻击目标、攻击策略进行故障注入，支持添加背景流量和资源监控，同时在故障注入能力的基础上

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

Kafka性能优化 Kafka性能优化优化客户端配置生产者配置建议可参考配置建议。消费者配置建议参数推荐值说明 max.poll.records 500 消费者一次能消费到的最大消息数量，默认为500，如果每条消息处理时间较长，建议调小该值，确保在max.poll.interval.ms

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RES03-04 支持容灾管理 - 云架构中心

RES03-04 支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
PERF03-06 选择合适的消息队列 - 云架构中心

PERF03-06 选择合适的消息队列风险等级中关键策略三种不同版分布式消息服务的适用场景如下： Kafka：兼容开源Kafka，适用构建实时数据管道、流式数据处理、第三方解耦、流量削峰去谷等场景，有大规模、高可靠、高并发访问、可扩展且完全托管的特点。 RocketMQ：兼容开源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

RES11-04 灾难演练通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常作为专项开展

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
SEC05-03 减少资源的攻击面 - 云架构中心

SEC05-03 减少资源的攻击面通过加固操作系统、减少未使用的组件和外部服务，以及使用工具加强云安全，减少资源的攻击面。风险等级高关键策略强化操作系统和减少组件：通过减少未使用的组件、库和外部服务，可以缩小系统在意外访问下的危险。这包括操作系统程序包、应用程序以及代码中的外部软件模块

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
应用运维管理(AOM2.0) - 云架构中心

应用运维管理(AOM2.0) 应用运维管理（Application Operations Management，简称AOM）是云上应用的一站式立体化运维管理平台，融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源，提供应用资源统一管理、一站式可观测性分析和自动化运维方案

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
PERF05-02 通用算法优化 - 云架构中心

PERF05-02 通用算法优化风险等级中关键策略算法优化是提高程序性能的关键，可以通过改进算法的设计和实现方式来提高其效率和性能。以下是一些最佳实践：使用正确的数据结构：选择合适的数据结构可以大辐提高算法的效率。例如，使用哈希表可以快速查找元素，使用数组可以快速访问元素

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 算法优化
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
SEC04-01 对网络划分区域 - 云架构中心

SEC04-01 对网络划分区域网络的分区是将网络划分为多个部分，以隔离不同敏感性要求的网络流量和资源，从而增加网络的安全性。风险等级高关键策略通过网络分区，可以实现以下目的：隔离敏感数据：将敏感数据和应用程序隔离在独立的网络分区中，以减少未经授权访问的风险。可扩展性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

问题和检查项企业在进行应用韧性设计的过程中，推荐使用如下问题寻找自身可以改进的点，并参考检查项/最佳实践进行改进，以下所有检查项，也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 RES01 您如何使用冗余技术确保应用系统的高可用？应用组件高可用部署应用组件多位置部署

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
安全性支柱简介 - 云架构中心
安全性支柱简介 - 云架构中心

安全性支柱简介华为将安全及隐私保护作为公司的最高纲领。安全性支柱旨在确保业务的安全、可信、合规，通过一系列华为云架构的最佳实践保护工作负载免受各种安全威胁，降低安全风险。安全性支柱涉及保护云上系统、资产、数据的机密性、完整性、可用性以及合法、合规使用数据，保护用户隐私的一系列最佳实践

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 概述
COST08-01 按地域规划应用架构 - 云架构中心

COST08-01 按地域规划应用架构风险等级中关键策略国家已启动“东数西算”工程，将东部发达地区的数据，传输到西部算力资源丰富的地区进行运算、存储。西部数据中心综合成本有明显优势，低PUE低能耗，如贵阳资源价格比广州上海等区域低10%左右。企业可将灾备、离线分析、转码、运维等对网络要求低的系统部署在贵阳

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据备份和恢复使用CBR云备份服务可对ECS的备份保护服务，支持基于多云硬盘一致性快照技术的备份服务，并支持利用备份数据恢复ECS数据。详见“云备份概述”。故障自愈当ECS支持自动恢复时，可以开启自动恢复能力，当物理服务器损坏时以冷迁移方式重启ECS实例，使弹性云服务器具备高可靠性和强大的动态迁移能力

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA DCS服务提供主备、Proxy集群、Cluster集群实例，通过节点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾

总条数： 217

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

基础概念 - 云架构中心

SEC03-03 定期审视权限 - 云架构中心

多活高可用(MAS) - 云架构中心

Kafka性能优化 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

PERF03-06 选择合适的消息队列 - 云架构中心

RES11-04 灾难演练 - 云架构中心

SEC05-03 减少资源的攻击面 - 云架构中心

应用运维管理(AOM2.0) - 云架构中心

PERF05-02 通用算法优化 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

SEC04-01 对网络划分区域 - 云架构中心

问题和检查项 - 云架构中心

安全性支柱简介 - 云架构中心

COST08-01 按地域规划应用架构 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线