搜索_华为云

RES06-01 故障模式分析 - 云架构中心

RES06-01 故障模式分析故障模式分析是在系统分析和设计过程，通过对各组成单元潜在的各种故障模式及其对产品功能的影响进行分析，并把每一种潜在故障模式按它的严酷度予以分类，找出单点故障和产品的薄弱环节，提出可以采取的预防改进措施，以提高产品可靠性的一种设计方法。当应用系统部署在华为云中时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

问题和检查项在迈向卓越运营的过程中，推荐使用如下问题寻找自身可以改进的点，并参考检查项/最佳实践进行改进，以下所有的检查项，也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 OPS01 您是否已经建立持续改进的团队文化和标准化运维体系？ 1. 建立持续学习和改进的文化

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
基础概念 - 云架构中心
基础概念 - 云架构中心

基础概念指标概念解读性能性能是指软件系统或软件对应其及时性要求的符合程度。及时性用响应时间或吞吐量来衡量。响应性响应性是系统实现其响应时间或吞吐量目标的能力。响应时间（RT）用户感受系统为其服务所耗费的时间。不同业务系统的响应时间期望值不同，如互联网业务多为500ms

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
PERF03-03 使用弹性伸缩 - 云架构中心

PERF03-03 使用弹性伸缩风险等级中关键策略如果工作负载能够支持弹性（例如：应用无状态化），请考虑具有自动缩放功能的计算服务，该功能可根据需求自动调整计算容量。自动缩放有助于确保在高峰期拥有足够的资源，并防止在低需求时段过度预配。虚拟机弹性伸缩和容器弹性伸缩都是实现应用自动化扩容和缩容的方式

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

RTO与RPO 灾难场景通常采用RTO和RPO目标定义：恢复时间目标RTO：指灾难发生后应用不可用的最长时间。RTO决定了应用容灾整体架构，是采用数据备份，还是冷备、温备、热备。恢复点目标RPO：指灾难发生后应用数据丢失的最大时间。RPO决定了数据备份频率或复制方式，是在线备份还是离线备份

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
OPS06-02 定义可观测对象 - 云架构中心

OPS06-02 定义可观测对象风险等级高关键策略客户可感知的观测对象分类如下：可观测分层功能 / 主要指标 IT 资源监控 IT 资源监控对 IT 资源的性能和容量进行监视和报告，确保您的业务稳定可靠运行应用监控应用监控基于应用资源管理对资源实行从应用、业务组件、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

问题和检查项企业在进行应用韧性设计的过程中，推荐使用如下问题寻找自身可以改进的点，并参考检查项/最佳实践进行改进，以下所有检查项，也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 RES01 您如何使用冗余技术确保应用系统的高可用？应用组件高可用部署应用组件多位置部署

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
OPS03-03 进行性能压测 - 云架构中心

OPS03-03 进行性能压测风险等级高关键策略性能压测主要通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试。通常把性能测试、负载测试、压力测试等统称为性能压测。广义而言，是为保证系统运行后的性能可以满足用户需求，而开展的一系列测试组织工作

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
PERF03 性能建模 - 云架构中心
PERF03 性能建模 - 云架构中心

PERF03 性能建模选择合适的计算资源选择合适网络服务资源选择合适的存储云服务选择合适的应用中间件云服务资源选择合适的数据库资源父主题：性能效率支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
PERF05-04 大数据场景资源优化 - 云架构中心

PERF05-04 大数据场景资源优化风险等级中关键策略在大数据场景下，可以通过优化资源的使用和分配，提高系统的性能和效率。以下是一些常见的大数据场景资源优化方法：分布式存储：使用分布式存储系统，如Hadoop HDFS、Apache Cassandra等，将数据分散存储在多个节点上

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
基础概念 - 云架构中心
基础概念 - 云架构中心

基础概念名称名词解释确定性运维确定性运维旨在构建可防、可控、可治的运维管理体系。首先是通过高质量的产品开发，严谨的运维流程和制度来降低故障的概率，要挑战零故障，同时也要有技术手段对可能发生的故障，将间隔、影响范围及故障恢复时间做到可防、可控、可治，要把数字化带来的“不确定性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
高可用设计 - 云架构中心
高可用设计 - 云架构中心

高可用设计具有高可用的系统必须避免单点故障，以防由于某个节点故障而导致整个系统不可用。 RES01 冗余 RES02 备份 RES03 跨AZ容灾 RES04 跨Region/跨云容灾 RES05 网络高可用父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES06-02 面向所有故障进行检测 - 云架构中心

RES06-02 面向所有故障进行检测针对所有故障场景，都需要能自动检测，以便及时发现和恢复故障。风险等级高关键策略所有故障都必须有检测。支持按不同维度进行故障检测，如Region、AZ、服务、方法、实例或容器ID等，检测维度与故障恢复方式对齐。检测到故障后需及时告警或自动恢复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
Serverless性能优化 - 云架构中心

Serverless性能优化 Serverless函数配置最佳实践运行时语言当选择编译型语言（如Java，C#等），冷启动时延一般由于首次初始化消耗比较大会导致冷启动时延偏高，但是初始化完成后每次执行的时延相较其他解释型语言（NodeJs，Python等）会有一定优势。如果流量不均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES07-01 定义关键指标与阈值并监控对资源进行监控时，需要先定义资源的关键指标以及对应的阈值，以便快速有效的发现业务表现和系统状态，以便在异常状态下尽早干预恢复，或定位改进系统缺陷。风险等级中关键策略关键指标需要与系统内工作负载的关键性能指标相关，并能确定为系统性能下降的早期警告信号

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
OBS对象存储服务 - 云架构中心
OBS对象存储服务 - 云架构中心

OBS对象存储服务对象存储服务（Object Storage Service，OBS）是一个基于对象的海量存储服务，提供海量、安全、高可靠、低成本的数据存储能力。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍

总条数： 168

上一页
1
...
5
6
7
8
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES06-01 故障模式分析 - 云架构中心

问题和检查项 - 云架构中心

基础概念 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

RTO与RPO - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

问题和检查项 - 云架构中心

常见故障模式 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

PERF03 性能建模 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

基础概念 - 云架构中心

高可用设计 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

常见故障模式 - 云架构中心

Serverless性能优化 - 云架构中心

常见故障模式 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

常见故障模式 - 云架构中心

OBS对象存储服务 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线