搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

问题和检查项在企业进行成本优化的过程中，推荐使用如下问题寻找自身可以改进的点，并参考检查项/最佳实践进行改进，以下所有的检查项，也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 COST01 您是否按照成本优化的需求，规划了相应的组织机构和流程？ 1. 规划

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
SEC09-02 安全事件记录及分析 - 云架构中心

SEC09-02 安全事件记录及分析在发生安全事件之前，可以考虑构建取证能力来支持安全事件调查工作。记录攻击和异常行为并对其分析：应在关键网络节点处（例如内外网的交界处、ELB流量转发处等）检测、防止或限制网络攻击行为；应采取技术措施对采集的安全日志进行持续监控和分析，实现对网

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
COST01-02 规划IT治理体系，提高管理效率 - 云架构中心

幅提升管理效率。财务独立模式下，企业主子各自管理各自账号下的成本，包括成本分析、预算跟踪、异常监控、成本建议等。如果企业子向企业主授权了查看消费信息，则企业主也可以统一分析企业主+企业子的成本。父主题： COST01 规划成本优化相应的组织机构和流程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
RES14-03 变更前数据备份 - 云架构中心

RES14-03 变更前数据备份通过配置数据事前备份与恢复设计，确保在出现配置错误时能够快速恢复到正确的配置数据状态。风险等级高关键策略进行全量数据备份，以防变更过程中数据被破坏，影响业务。异常回滚时，可使用备份数据进行恢复。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
COST06-02 为工作负载选择合适的计费模式 - 云架构中心

COST06-02 为工作负载选择合适的计费模式风险等级中关键策略分析工作负载的每个组件。确定组件和资源是长时间运行（应享受承诺折扣，包年包月或购买资源包），还是短时间动态运行（采用 Spot 或按需定价）。使用成本管理工具中的建议对工作负载执行分析，并对这些建议应用业务规则以实现高回报。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST06 使用不同计费模式优化成本
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

问题和检查项在迈向卓越运营的过程中，推荐使用如下问题寻找自身可以改进的点，并参考检查项/最佳实践进行改进，以下所有的检查项，也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 OPS01 您是否已经建立持续改进的团队文化和标准化运维体系？ 1. 建立持续学习和改进的文化

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES12-01 组建应急恢复团队 - 云架构中心

RES12-01 组建应急恢复团队为了应对紧急故障场景，需要组建应急恢复团队，明确责任人，并进行培训。风险等级高关键策略组建应急恢复团队：其中包括应急恢复主席及所有组件及关键依赖项的恢复责任人。应急恢复主席：在出现问题后及时组织应急恢复团队进行快速恢复处理。组件或关

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
COST05-02 建立可以量化的优化目标 - 云架构中心

COST05-02 建立可以量化的优化目标风险等级高关键策略成本优化是一项投资，而且是一个需要持续进行的流程。为了向公司或者组织的决策者、利益相关方说明投资的价值，就需要对成本优化自身，尤其是其执行的目标进行量化。从而在持续的优化活动中，都可以从决策者或者利益相关者那里得

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
PERF04-04 资源性能数据收集 - 云架构中心

PERF04-04 资源性能数据收集风险等级中关键策略每个华为云提供的云服务都有一组特定于资源功能的指标，用于呈现有关资源的使用情况。通过收集资源性能数据，可以深入了解工作负载的运行状况和行为。指标作用：帮助你了解资源的运行状况和性能，在云监控平台上配置对应的告警策略和配置指标看板。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能负载均衡配合弹性负载均衡ELB服务，可以对弹性伸缩组创建的弹性云服务器进行负载均衡。健康检查健康检查会将异常的实例从伸缩组中移除，伸缩组会重新创建新的实例以维持伸缩组的期望实例数和当前实例数保持一致，伸缩组的健康检查方式主要包括以下两种。云服务器健康检查：是指

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
SEC10-01 建立安全响应团队 - 云架构中心

SEC10-01 建立安全响应团队建立安全事件响应团队，明确各角色与职责。风险等级高关键策略安全事件响应团队一般包含如下角色及职责：安全响应专家：主导网络安全事件调查，负责对事件进行定级、通报、攻击溯源以及确定影响范围，制定应急处置措施，推动服务控制风险。攻击溯源专

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
SEC03-04 安全共享资源 - 云架构中心

SEC03-04 安全共享资源大企业的不同组织、部门、团队之间需要安全共享资源。风险等级中关键策略大企业往往涉及多个组织单元、多个账号，需要对多账号之间进行共享资源。安全共享资源需遵循以下实践：使用资源标签。通过标签对资源进行分类和标记，以便于管理和应用策略。仅与可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
COST05-03 定期回顾和审核 - 云架构中心

COST05-03 定期回顾和审核风险等级高关键策略为了让云上应用始终最具成本效益，推荐您定期对其进行回顾和审核，以了解是否有机会实施新的优化措施。回顾和审核可以基于成本分配的原则，在应用级别执行，持续审核组织为每个云上应用付出的总体成本。通过综合考虑云资源成本，研发成本，运营管理成本（如托管服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
RES01-03 云服务器反亲和 - 云架构中心

RES01-03 云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ECS，需要配置主机组反亲和，从而可以将相同业务的ECS调

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余

总条数： 290

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

问题和检查项 - 云架构中心

SEC09-02 安全事件记录及分析 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

常见故障模式 - 云架构中心

COST01-02 规划IT治理体系，提高管理效率 - 云架构中心

RES14-03 变更前数据备份 - 云架构中心

COST06-02 为工作负载选择合适的计费模式 - 云架构中心

常见故障模式 - 云架构中心

问题和检查项 - 云架构中心

常见故障模式 - 云架构中心

RES12-01 组建应急恢复团队 - 云架构中心

COST05-02 建立可以量化的优化目标 - 云架构中心

PERF04-04 资源性能数据收集 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

SEC10-01 建立安全响应团队 - 云架构中心

SEC03-04 安全共享资源 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线