搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如云数据库 TaurusDB实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当云数据库 TaurusDB实例由于过载导致网络限制时，可参考“RDS的CPU /内

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当RDS实例由于过载导致网络限制时，可参考“RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高”的处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
OPS03-05 进行混沌测试和演练 - 云架构中心

的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审 (PRR)、性能压测，确保系统能够持续提供稳定、可靠的服务。混沌工程从应用部署架构、服务容量、监控告警、应用高

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源风险等级中关键策略根据工作负载和资源特征选择合适的资源大小或类型。您可通过持续监控资源利用率，发现资源的利用率低于/高于阈值，选择降配或者升配资源来优化成本。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
COST08-04 Serverless探索 - 云架构中心

本，Serverless架构最大限度计算、存储、网络等资源，提升整体资源利用率、缩短需求发布周期，提高应用的研发效率。用户可以通过云监控服务监控Serverless实例的CPU使用率、内存使用率，当满足一定条件，自动触发Serverless算力扩容和缩容，从而提供资源使用率，降低成本。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

主灾备（详见“云数据库 TaurusDB到云数据库 TaurusDB单主灾备” ），或双主灾备（详见“云数据库 TaurusDB到云数据库 TaurusDB双主灾备”）。监控告警配合CES服务，支持对云数据库 TaurusDB的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
OPS06-05 实施依赖项遥测 - 云架构中心

OPS06-05 实施依赖项遥测风险等级高关键策略依赖项遥测可以监控工作负载所依赖的外部服务和组件的运行状况及性能。提供有关与 DNS、数据库或第三方 API 等依赖项相关的可访问性、超时及其他关键事件的高价值指标采集。当对应用程序进行检测，以发布有关这些依赖项的指标、日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
PERF04-06 建立性能可观测性体系 - 云架构中心

可观测性体系是指在云原生架构中通过使用各种工具和技术来实现对应用程序和基础设施的监控告警、日志、故障排除等功能的一套完整的解决方案。性能可观测体系在此基础上突出了性能指标，通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。性能监控对象：服务器、操作系统、数据库、应用程序、网络设备、云服务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

备实例之间的单主灾备（详见“MySQL到MySQL单主灾备”）或双主灾备（详见“MySQL到MySQL双主灾备”）。监控告警配合CES服务，支持对RDS的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。父主题： RDS云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
RES06-03 支持亚健康检测 - 云架构中心

典型的例子是内存泄漏，内存泄漏往往不会立刻导致系统失效，系统首先会因为Swap Memory不足变得运行缓慢，消耗内存量持续增加，因此通过监控实例内的内存占用率，在超过阈值的情况下及时告警，人工介入迅速恢复，可避免造成业务中断。典型的亚健康场景有：通信链路丢包/错包、硬盘性能下

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
PERF03-11 选择合适的非关系型数据库 - 云架构中心

PERF03-11 选择合适的非关系型数据库风险等级中关键策略华为云数据库提供了DDS、GeminiDB两种非关系型数据库服务。 DDS：文档数据库服务（Document Database Service）完全兼容MongoDB协议，提供安全、高可用、高可靠、弹性伸缩和易

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的数据库资源
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
应用管理与运维平台(ServiceStage) - 云架构中心

应用管理与运维平台(ServiceStage) 应用管理与运维平台（ServiceStage）是面向企业的应用管理与运维平台，提供应用发布、部署、监控与运维等一站式解决方案。支持Java、Php、Python、Node.js、Docker、Tomcat技术栈。支持Apache ServiceComb

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES14-02 自动化变更 - 云架构中心

识别潜在风险和冲突，并采取相应的措施进行风险管理。自动化测试和验证：验证变更的正确性以及性能、可靠性影响，减少人工测试的错误和延迟。监控和审计变更过程：追踪和记录变更执行情况，及时发现和解决问题，提供透明度和可追溯性。相关云服务和工具云运维中心 COC：作业管理：提供

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

风险发现个数与等级：定期评估分析（季度或年度）主动发现的风险数量和级别。风险消减个数、等级与类型：风险降级的数量，风险消减的数量，增加预案的数量，改进监控项的数量。故障恢复时长提升率：对应故障场景经过混沌工程演练，平均恢复速度提升的比率。故障数量相比上年减少数量：本年度故障数量相比上年度减少多少。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES15-04 灰度部署和升级 - 云架构中心

当检查到任何行为更改或错误时，可以将Canary中的流量删除，并将用户发回到以前的版本。如果部署成功，则可以继续以期望的速度进行部署，同时监控更改以便发现错误，直到所有部署完成。蓝绿部署与金丝雀部署类似，只是会并行部署一整套应用程序，形成两套生产环境：蓝环境和绿环境，蓝色是当前

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
双Region方案 - 云架构中心
双Region方案 - 云架构中心

Kafka、RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS for My

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES05-01 网络连接高可用 - 云架构中心

公有云组网场景可通过多EIP 弹性IP及DNS域名解析实现网络连接的高可用；对可用性要求较高的场景，需要支持智能DNS功能，能对EIP进行异常监控和自动切换；此外DNS自身也需要冗余容错，避免由于DNS故障而导致域名解析失败，业务中断。混合云组网场景链路冗余与倒换方案：双DC专线

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
RES11 可靠性测试 - 云架构中心
RES11 可靠性测试 - 云架构中心

和能力提出了更高要求。可靠性测试和演练通过主动引入故障来充分验证软件质量的脆弱性，从而提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生前有效预防，故障发生时及时应对，故障恢复后回归验证。基于故障本身打造分布式系统韧性，持续提升软件质

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复

总条数： 215

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

COST08-04 Serverless探索 - 云架构中心

可靠性功能 - 云架构中心

OPS06-05 实施依赖项遥测 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

可靠性功能 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

PERF03-11 选择合适的非关系型数据库 - 云架构中心

常见故障模式 - 云架构中心

应用管理与运维平台(ServiceStage) - 云架构中心

RES14-02 自动化变更 - 云架构中心

RES11-01 混沌测试 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

双Region方案 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

RES11 可靠性测试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线