搜索_华为云

RES06-01 故障模式分析 - 云架构中心

的故障管理，应用系统可减少对机房、电力、环境、计算服务器、存储设备、网络交换机等基础设施的故障模式的检测和恢复处理，但仍需考虑这些基础设施故障对应用系统的影响及对应的恢复措施，如机房发生灾难(AZ或Region级灾难)、计算服务器故障/重启、使用本地硬盘时硬盘故障/亚健康、网络通

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

维知识，可以帮助运维人员快速解决问题，提高工作效率。一般通过运维知识库系统承载，运维人员可以轻松地查找和获取各种运维知识，包括网络配置、服务器管理、数据库维护等方面的知识。下面将介绍运维知识库系统的五个主要功能和优势。丰富的知识资源：运维知识库系统收集整理了大量的运维知识和经验

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
SEC01-03 梳理资产清单 - 云架构中心

SEC01-03 梳理资产清单梳理工作负载涉及的服务器、IP地址、域名、数据库、证书等全量云资源的资产清单，给资源打上标签，从而在出现安全事件时，能快速定位到有安全风险的资源。风险等级高关键策略设计态与运行态一致性：对照设计态的架构图、架构文档实施云服务资源。工作负载运行时的架构始终保持与设计态一致。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

当客户端请求超时或收到错误响应时，客户端需要决定是否重试；重试有助于客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。根据错误响应码进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
PERF05 性能优化 - 云架构中心
PERF05 性能优化 - 云架构中心

PERF05 性能优化性能优化工作中，需警惕“过早优化”的问题。我们的基本指导策略还是首先让系统运行起来，再考虑怎么让它变得更快。一般只有在我们证实某部分代码的确存在一个性能瓶颈的时候，才应进行优化。除非用专门的工具分析瓶颈，否则很有可能是在浪费自己的时间。另外，性能优化的隐含

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

故而应该制定策略，确定您的组织应该如何管理资源。如上文所说的，可以使用账号隔离不同组织/部门的资源，甚至于在同一个组织/部门内部，开发，测试，核心业务，非核心业务，也使用不同的账号和环境。然而即使账号/环境是分散的，云资源管理策略和权限管理机制应该是集中的。企业的中心团队，如上文所提的云业务办公室、云卓越中心或

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

给其他所有成员账号使用公共服务管理团队镜像服务IMS、容器镜像服务SWR、弹性文件服务SFS、对象存储服务OBS、自建NTP服务器、自建AD服务器等公共资源安全云脑SecMaster、云审计服务CTS、配置审计Config、企业主机安全HSS、数据安全中心DSC 业务账号

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。 broker_cpu_core_load CPU核均负载该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。 broker_memory_usage 内存使用率该指标为Kafka节点虚拟机层面采集的内存使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RES02-02 自动数据备份 - 云架构中心

云备份CBR服务：CBR提供对磁盘（EVS）、服务器（ECS、HECS、BMS）基于快照的备份和恢复能力，SFS Turbo文件系统备份，云服务器部署的MySQL或SAP HANA等数据库备份，以及云上同步和管理线下备份软件OceanStor BCManager和VMware虚拟机的备份数据。CBR支持

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
PERF01-01 全生命周期性能管理 - 云架构中心

点插入代码，探测器）使测试和分析负载场景、资源需求、性能目标达成一致。使用监控工具来分析历史趋势，并识别支配性占比的数据流和代码实现路径。本原则强调采取措施使性能指标可测试，可以利用商用工具测试质量指标，也可以在设计时考虑相关性能指标的可测试性措施。需要测试的数据包括响应时间，处

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
SEC10-04 安全事件演练 - 云架构中心

SEC10-04 安全事件演练安全事件演练是一种模拟性的活动，旨在让组织成员在一个模拟的安全事件场景下进行实际操作和应对，以测试和提高其应对安全事件的能力。通过安全事件演练，组织可以评估其安全事件响应计划的有效性，发现潜在的问题并进行改进，提高团队的准备性和反应能力。风险等级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
AS弹性伸缩 - 云架构中心
AS弹性伸缩 - 云架构中心

则来自动增加/缩减业务资源。当业务需求增长时，AS自动增加弹性云服务器（ECS）实例或带宽资源，以保证业务能力；当业务需求下降时，AS自动缩减弹性云服务器（ECS）实例或带宽资源，以节约成本。AS支持自动调整弹性云服务器和带宽资源。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

备份，在数据被删除时使用备份数据快速恢复。 BMS实例物理服务器或本地盘故障检测：应用层检测物理服务器和本地盘运行状态恢复：应用层采用RAID实现BMS内硬盘高可用，并实现跨BMS的数据复制与高可用，以便在物理服务器或本地盘故障时业务可快速恢复。建议非必须使用本地盘场景，尽可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

进行站点运行状态检查，在发生故障时告警；针对ECS、RDS实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容针对内部用户场景，资源足够，无需自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可根据ECS监控情况随时添加和移除ECS实例来扩展应用系统的服务能力；针

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
SEC01-04 分隔工作负载 - 云架构中心

独立运行和管理，从而提高系统的安全性和可维护性。风险等级高关键策略一个企业特别是大型企业往往有多个不同类型（如生产环境、开发环境、测试环境）或不同组织单元（OU）下的工作负载，多个组织单元之间或多个工作负载之间要进行隔离。分隔工作负载在云环境中是非常重要的。从安全治理角度，主要基于以下几个理由：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
BMS裸金属服务 - 云架构中心
BMS裸金属服务 - 云架构中心

BMS裸金属服务裸金属服务（Bare Metal Server，BMS）是一款兼具弹性云服务器和物理机性能的计算类服务，为企业提供专属的云上物理服务器，为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算性能以及数据安全。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
信息管理类应用典型部署架构（99.95%） - 云架构中心

按照以上评估，每年应用系统不可用的时长是240分钟，满足可用设计目标要求。信息管理类应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用ECS或CCE（以CCE为例），通过ELB负载均衡；后端数据库基于不同业务类型可采用不同数据库，通常采用GaussDB提供更高性能与可靠性；基于

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
CCE云容器引擎 - 云架构中心
CCE云容器引擎 - 云架构中心

CCE云容器引擎云容器引擎（Cloud Container Engine，简称CCE）提供高度可扩展的、高性能的企业级Kubernetes集群，支持运行Docker容器。借助云容器引擎，可以在云上轻松部署、管理和扩展容器化应用程序。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

些原因主备切换时，会导致连接中断，需要客户端重试。实例由于故障重启可能会导致通信中断，如ECS所在物理服务器由于硬件原因故障时，ECS重启或在其他物理服务器中自动恢复，恢复过程中与ECS的通信会中断，需要重试。实例由于过载导致无法及时响应，需要重试。 RES09-01 API及命令调用需要设计为可重试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复

总条数： 138

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES06-01 故障模式分析 - 云架构中心

OPS08-03 知识管理 - 云架构中心

SEC01-03 梳理资产清单 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

PERF05 性能优化 - 云架构中心

COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

组织级参考架构 - 云架构中心

Kafka性能优化 - 云架构中心

RES02-02 自动数据备份 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

SEC10-04 安全事件演练 - 云架构中心

AS弹性伸缩 - 云架构中心

常见故障模式 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

SEC01-04 分隔工作负载 - 云架构中心

BMS裸金属服务 - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

CCE云容器引擎 - 云架构中心

RES09 故障重试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线