搜索_华为云

RES04-03 容灾恢复过程自动化 - 云架构中心

RES04-03 容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
PERF04-05 应用性能数据采集 - 云架构中心

通过框架引入到代码库中，可以在运行时采集相关的性能数据。自定义检测：仅当平台指标不足时，才建议开发人员可以添加自定义代码采集独有的性能指标。使用业界可观测的标准。请考虑使用围绕业界标准构建的工具，例如OpenTelemetry。建议：使用分布式的调用链技术，可以识别多个服务和组件之

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
SEC02-01 对账号进行保护 - 云架构中心

账号是华为云租户的账号体系中权限最高的用户，拥有对整个云环境的最高权限。一旦账号受到攻击或泄露，可能导致严重的安全问题和数据泄露。因此，身份认证的安全性首先要考虑对此账号进行保护。风险等级高关键策略强密码：使用强密码来保护账号，包括数字、字母、特殊字符的组合，并确保密码足够长且复杂。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
PERF06-02 性能劣化自动定界定位 - 云架构中心

关键策略通过建立的分层性能模型，判断系统是否会出现性能劣化的情况。当出现劣化事件时，需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层指标的聚合可视化能力，需要依赖持续的资源治理和数据治理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
OPS07-03 支持事件管理 - 云架构中心

事件(incidents)是需要干预的事情。当发生事故(incidents)时，通过流程来处理。如何与团队沟通活动的状态？谁负责响应处置？使用哪些工具来缓解该事件？这些都是流程中需要回答的问题，并需要获得可靠的响应过程。流程必须中心化，并且可供参与工作负载的任何人使用。如果没有wiki

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS07-01 创建可操作的告警 - 云架构中心

告警问题，清除明确的告警误报。设计建议优化告警阈值：适当提高内存／CPU／网络 IO 告警阈值。优化日志级别：优化不合理的日志级别，把部分 ERROR 级别的日志调整为 WARNING。屏蔽某些日志：对难以调整日志级别的应用，根据关键字屏蔽某些频繁的日志告警。预警增强：对于某些影响业务方的操作，提供预警。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
SEC05 运行环境安全 - 云架构中心

SEC05 运行环境安全 SEC05-01 云服务安全配置 SEC05-02 实施漏洞管理 SEC05-03 减少资源的攻击面 SEC05-04 密钥安全管理 SEC05-05 证书安全管理 SEC05-06 使用托管云服务父主题：基础设施安全

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全
OPS03-05 进行混沌测试和演练 - 云架构中心

混沌工程度量指标故障场景的覆盖率：分析故障场景的覆盖率，例如容灾场景覆盖 80%，过载场景覆盖 60%。故障场景的命中率：分析故障场景中，真实发生的比率。应急预案的质量：用于度量应急预案有效性和执行效率。风险发现个数与等级：定期评估分析（季度或年度）主动发现的风险数量和级别。风

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
OPS03-03 进行性能压测 - 云架构中心

合系统的业务要求，主要的测试分类包括：负载测试：是指在一定的软件、硬件及网络环境下，运行一种或多种业务，在不同虚拟用户数量的情况下，测试环境的性能指标是否在用户的要求范围内，以此确定系统所能承载的最大用户数、最大有效用户数以及不同用户数下系统响应时间及硬件设备或云服务的资源利用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
COST03-01 制定成本分摊原则 - 云架构中心

成本分配支撑企业将成本分配到各业务团队中，使得各业务团队的成本清晰可见。这也是上文中明确的团队责任的基础。根据清晰的成本，业务部门可准确定价，并平衡成本、稳定性和性能，经济高效的提供领先方案。企业管理者基于数据决策各业务的云开支，保障核心业务和战略业务方向的支出，不超支，不浪费。成本分配需匹配业务实质，具体有以下几个原则：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
RES03-04 支持容灾管理 - 云架构中心

RES03-04 支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES07-04 监控数据存储和分析 - 云架构中心

RES07-04 监控数据存储和分析监控数据包括统计和日志信息，均需要存储并进行生命周期管理，以满足数据监控的保留要求；并定期对其进行分析，以了解系统运行状态和趋势。风险等级中关键策略监控数据存储时长需要满足保留要求。监控数据需要定期分析，以便发现或预测系统故障，减少业务中断。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

Engineering）是通过故障注入的方式，触发或模拟实际故障，验证系统的稳定性和容错保护能力。风险等级高关键策略在真实环境中测试。作为CI/CD管道的一部分例行执行。主动注入故障，以便在问题发生前提前发现并解决问题。以可控方式注入故障，减少对客户的影响。混沌工程度量指标：故障场景的覆盖率：分析故障场景的覆盖率，例如容灾场景覆盖

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
SEC02-02 安全的登录机制 - 云架构中心

SEC02-02 安全的登录机制将安全的登录机制用于账号、IAM用户以及对接第三方身份提供商。风险等级高关键策略除了账号，确保IAM管理员（有管理员权限的IAM用户）也开启MFA机制登录，避免登录凭证泄露带来的风险。配置IAM的登录验证策略，如会话超时策略、账号锁定策略、账号停用策略、最近登录提示等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
SEC01-04 分隔工作负载 - 云架构中心

不同的VPC中，每个VPC具有独立的网络空间，实现网络隔离。通过企业项目分隔工作负载：企业项目是云服务资源的逻辑集合，将工作负载部署在不同的企业项目中，实现资源的分组管理和权限控制。通过多账号分隔工作负载：将不同的工作负载部署在不同的华为云账号中，每个账号具有独立的身份验证、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
RES04 跨Region/跨云容灾 - 云架构中心

为了预防区域级灾难发生，或业务跨云容灾需求，需要构建容灾系统提供较为完善的数据保护与灾难恢复能力，以便在站点级灾难发生时，可以保证生产系统的数据尽可能少的丢失，业务系统能在最短时间内由灾备中心接替，恢复业务系统的正常运行，将损失降到最小。对于跨Region容灾场景，应用系统可在多

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
设计原则 - 云架构中心
设计原则 - 云架构中心

试，部署的开发周期较小，使用频繁的小型迭代进行。一个典型的实践是使用微服务和CI/CD实践，微服务架构是一种更为灵活、可扩展和易于维护的架构风格，已经逐渐成为现代应用开发的主流选择。它通过将应用程序拆分为小的、自治的服务，每个服务都负责执行特定的业务功能，可以使用不同的技术栈，由

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱

总条数： 242

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES04-03 容灾恢复过程自动化 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

SEC02-01 对账号进行保护 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

SEC05 运行环境安全 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

COST03-01 制定成本分摊原则 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

RES07-04 监控数据存储和分析 - 云架构中心

RES11-01 混沌测试 - 云架构中心

SEC02-02 安全的登录机制 - 云架构中心

常见故障模式 - 云架构中心

SEC01-04 分隔工作负载 - 云架构中心

RES04 跨Region/跨云容灾 - 云架构中心

设计原则 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线