搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源风险等级中关键策略根据工作负载和资源特征选择合适的资源大小或类型。您可通过持续监控资源利用率，发现资源的利用率低于/高于阈值，选择降配或者升配资源来优化成本。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
OPS03-05 进行混沌测试和演练 - 云架构中心

的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审 (PRR)、性能压测，确保系统能够持续提供稳定、可靠的服务。混沌工程从应用部署架构、服务容量、监控告警、应用高

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

跨AZ容灾 CCE服务支持跨AZ创建或扩展容器集群，工作负载自动在多个AZ间均匀分配。监控告警 CCE支持配合AOM对集群进行全方位的监控，包括集群、节点、工作负载、容器实例POD等。详见“监控概述”。父主题： CCE云容器引擎

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

配合动态伸缩AS服务，可以实现跨AZ的ECS实例重建或均衡。跨AZ容灾配合ELB服务，可以实现跨AZ的故障切换。监控告警配合CES服务，支持对ECS的CPU、内存、磁盘、网络等进行监控和告警。详见“监控弹性云服务器”。父主题： ECS弹性云服务器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
RES12-04 出现问题后尽快恢复业务 - 云架构中心

出现问题后尽快恢复业务应用系统出现故障后，需要能尽快发现，尽快响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
SEC01-03 梳理资产清单 - 云架构中心

自动化资产盘点：使用安全云服务或工具来自动发现和记录云上资源，包括主机、存储、数据库、网络等。这样可以确保资产清单的及时性和准确性。标签和元数据：使用标签和元数据来对云资源进行分类和描述，以便更好地组织和管理资源清单。通过标签可以快速识别和过滤资源，有助于监控和安全审计。相关云服务和工具解决方案工作台

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
OPS06-05 实施依赖项遥测 - 云架构中心

OPS06-05 实施依赖项遥测风险等级高关键策略依赖项遥测可以监控工作负载所依赖的外部服务和组件的运行状况及性能。提供有关与 DNS、数据库或第三方 API 等依赖项相关的可访问性、超时及其他关键事件的高价值指标采集。当对应用程序进行检测，以发布有关这些依赖项的指标、日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

RES05 您如何保证网络高可用？网络连接高可用避免暴露不必要的网络地址不同流量模型业务的网络共享带宽隔离预留IP资源以便扩展和高可用 RES06您如何进行故障检测处理？故障模式分析面向所有故障进行检测支持亚健康检测 RES07 您如何监控应用系统资源？定义关键指标与阈值并监控

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

s使用的正常现象。Redis使用受到网络传输、客户端设置超时时间等因素影响，可能出现单个请求超时问题。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当DCS实例由于过载导致网络限制时，可参考“DCS的CPU /内

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败检测：网络连接失败。恢复：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
设计原则 - 云架构中心
设计原则 - 云架构中心

亚健康检测：对不引起系统故障却导致系统或服务KPI下降的亚健康异常需要能检测，如网络时延变大、磁盘变慢、内存泄露等亚健康故障。备用检测：冗余系统中，主备用模块的故障都需要检测，避免静默故障。有特殊寿命器件：应及时监控有特殊寿命（如本地硬盘）要求的期间健康状态，通过提前预警采取维护错误，避免故障的突然发生造成严重影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

健康检查。详见“修改健康检查配置”。跨AZ容灾配合ELB服务，可以实现跨AZ的故障切换。监控告警配合CES服务，支持对BMS的CPU、内存、磁盘、网络等进行监控和告警。详见“监控指标说明”。父主题： BMS裸金属服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
PERF06-01 分层看护 - 云架构中心

分层看护风险等级高关键策略基于业务的部署架构，一般可以从最底层的硬件基础设施到最上层的应用分成5层资源，云上服务可以只需要关注虚拟网络、实例、应用三层。结合每一层资源的特征指标进行分层建模，分别设置不同梯度的性能看护指标。通常按照指标劣化程度可以设计成一般、紧急、重要三个

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

容灾，当一个AZ异常时，另一个AZ节点不受影响，备节点会自动升级为主节点，对外提供服务。监控告警配合CES服务，支持对DCS的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。父主题： DCS分布式缓存服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
应用管理与运维平台(ServiceStage) - 云架构中心

应用管理与运维平台(ServiceStage) 应用管理与运维平台（ServiceStage）是面向企业的应用管理与运维平台，提供应用发布、部署、监控与运维等一站式解决方案。支持Java、Php、Python、Node.js、Docker、Tomcat技术栈。支持Apache ServiceComb

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍

总条数： 172

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

SEC01-03 梳理资产清单 - 云架构中心

OPS06-05 实施依赖项遥测 - 云架构中心

问题和检查项 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

设计原则 - 云架构中心

可靠性功能 - 云架构中心

PERF06-01 分层看护 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

应用管理与运维平台(ServiceStage) - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线