搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES03-01 集群跨AZ部署 - 云架构中心

现跨AZ容灾；以ECS为例：对于无状态ECS实例，可利用AS弹性伸缩服务的跨AZ伸缩能力，或ELB跨AZ负载均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
SEC06-04 应用安全配置 - 云架构中心

服务运行用户，例如服务运行的用户是否为最低权限用户，禁止使用root用户运行服务。 Web攻击，例如Web应用是否存在SQL注入、XSS跨站脚本、文件包含、目录遍历、敏感文件访问、命令、代码注入、网页木马上传、第三方漏洞攻击等常见Web威胁问题。相关云服务和工具企业主机安全 HSS Web应用防火墙 WAF 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
选择合适的计算资源 - 云架构中心

包括实例类型、可伸缩性和容器化等因素。不同的计算服务具有不同的功能和特征，可能会影响工作负载的性能。选择最佳计算服务以确保工作负载高效运行。请考虑以下策略：了解实例类型不同的实例类型针对不同的工作负载进行优化，例如CPU优化、内存优化和GPU优化，选择符合需求的实例类型。考虑自动缩放

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有： APM

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源风险等级中关键策略根据工作负载和资源特征选择合适的资源大小或类型。您可通过持续监控资源利用率，发现资源的利用率低于/高于阈值，选择降配或者升配资源来优化成本。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
OPS03-05 进行混沌测试和演练 - 云架构中心

OPS03-05 进行混沌测试和演练混沌工程（Chaos Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
单Region方案 - 云架构中心
单Region方案 - 云架构中心

各部署一套，提供同城容灾能力。接入层（外部GSLB）：通过外部GSLB进行域名解析与流量负载均衡，在单个AZ故障时自动将业务流量切换到另一AZ。应用层（负载均衡器、应用软件及容器）：对于无状态应用，通过负载均衡器进行故障检测与负载均衡，并可通过容器进行弹性伸缩。中间件层：每个可用区各部署一套DCS、DMS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
双Region方案 - 云架构中心
双Region方案 - 云架构中心

支持业务运行状况、成功指标的检查，在发生故障时告警；支持ECS、DCS、Kafka、RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES12-04 出现问题后尽快恢复业务 - 云架构中心

响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及时告警，并能通过短消息、邮件等方式发送给所有相关人员，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
基础概念 - 云架构中心
基础概念 - 云架构中心

确定性运维旨在构建可防、可控、可治的运维管理体系。首先是通过高质量的产品开发，严谨的运维流程和制度来降低故障的概率，要挑战零故障，同时也要有技术手段对可能发生的故障，将间隔、影响范围及故障恢复时间做到可防、可控、可治，要把数字化带来的“不确定性”通过运维变成“确定性”。 IaC 基础设施即代码

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

进行站点运行状态检查，在发生故障时告警；针对ECS、RDS实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容针对内部用户场景，资源足够，无需自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可根据ECS监控情况随时添加和移除ECS实例来扩展应用系统的服务能力；针

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
工作负载级参考架构 - 云架构中心

Web类攻击采用WAF防护采用SSL证书进行通信加密互联网边界、VPC之间采用云防火墙运行环境安全企业主机安全服务保护主机安全和容器安全 VPC内访问控制使用网络ACL+安全组使用漏洞扫描服务定时扫描云上各资源漏洞数据安全数据安全中心实现数据全生命周期安全存储默认启数据加密关键数据库部署数据库安全服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
COST06-01 了解云上不同计费模式的特点 - 云架构中心

云服务存在按需、包年包月、资源包、竞价实例等多种计费模式，不同的计费模式有着不同的适用场景。企业或者组织需要根据自己的需要，了解不同计费模式的特点，合理选择各种计费模式来适配不同的业务形态和降低费率，实现成本节省。按需计费：适用于临时、突发的业务场景；包年包月：通过预付一定周期的资源使用费

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST06 使用不同计费模式优化成本
RES12-03 定期应急恢复演练 - 云架构中心

定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具风险等级高关键策略流程和工具是经验的承载，通过标准化的流程，可以大幅降低在运维过程中因为个人的因素受到的影响和无序化。通过标准化的、统一的运维工具，向运维人员提供集中、统一维护界面及清晰易上手的操作手册，方便运维人员的集中维护，提高运维效率。常见的运维流程有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
RES13-06 压力负载测试 - 云架构中心

RES13-06 压力负载测试通过压力测试，可衡量系统的弹性扩容能力是否能满足业务要求。风险等级高关键策略参见“RES11-02 压力负载测试”章节。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

接入层（外部DNS、API网关）：通过外部DNS进行域名解析，在IDC/其他云故障时手工将业务流量切换到华为云。应用层（负载均衡器、应用软件及虚拟机或物理主机）：对于无状态应用，通过负载均衡器进行故障检测与负载均衡，在华为云上可通过AS弹性伸缩服务监控负载进行弹性伸缩；对于有状态应用，通过SDRS服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
OPS06-06 实施分布式跟踪 - 云架构中心

流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时，标识符将被添加到请求中，并在整个系统中传递。每

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系

总条数： 258

上一页
1
...
6
7
8
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

SEC06-04 应用安全配置 - 云架构中心

选择合适的计算资源 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

单Region方案 - 云架构中心

双Region方案 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

基础概念 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

工作负载级参考架构 - 云架构中心

COST06-01 了解云上不同计费模式的特点 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

RES13-06 压力负载测试 - 云架构中心

跨云容灾方案 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线