搜索_华为云

什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

不过，即使应用系统利用云平台能力具有了这些高可用能力，要实现较高的可用性，仍需要构建针对各种偶发故障下的恢复能力，如：由于硬件故障导致的高可用切换或跨AZ切换过程中，导致瞬时链接中断，需要应用系统具备链接中断重试的功能。由于外部流量突发导致业务过载，需要应用系统具备流量控制的能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

部，开发，测试，核心业务，非核心业务，也使用不同的账号和环境。然而即使账号/环境是分散的，云资源管理策略和权限管理机制应该是集中的。企业的中心团队，如上文所提的云业务办公室、云卓越中心或 FinOps 团队需要为各个账号环境实施与策略一致的组和角色，控制每个组中谁可以创建、修

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败检测：网络连接失败。恢复：至少部署2个后端ECS。对于无状态业务，配置ELB弹性负

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
OPS03-05 进行混沌测试和演练 - 云架构中心

Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES13-04 支持主动扩容 - 云架构中心

RES13-04 支持主动扩容当由于计划性活动而导致资源需求增加时，需要支持主动扩容，避免由于资源不足而导致业务受影响。风险等级高关键策略当发现应用系统业务需要更多资源时，可主动扩展资源以满足需求，而避免影响可用性。典型场景如产品促销前预测会有突发大流量，则可手工进行扩容处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

Redis使用规范如下的规范可以帮助我们在系统运行过程中，尽可能减少遇到redis不稳定或异常的概率，保证系统的长稳运行。业务使用规范原则原则说明级别备注就近部署业务，避免时延过大如果部署位置过远（非同一个region）或者时延较大（例如业务服务器与Redis实例通过公网连接），网络延迟将极大影响读写性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES01-02 应用组件多位置部署 - 云架构中心

应用组件需要部署在多个数据中心，以避免单个数据中心故障而导致业务中断。风险等级高关键策略可根据不同需求，将应用的数据和资源部署在多个位置：应用多AZ部署：应用应尽可能部署在多个可用区，避免由于单个可用区故障而导致所有业务中断。应用多Region部署：对于可用性要求高的应用系统，需要考虑多Region部

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
Serverless性能优化 - 云架构中心

数同步调用会等待直到超出超时时间才返回超时异常，造成业务卡顿，长时间不退出等问题，无法实现failfast，影响业务体验。建议结合业务实际场景配置超时时间，避免超时时间配置过大。 Serverless函数代码最佳实践如果业务可以异步实现，那么不需要关心函数的性能（除了优化成本之

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
PERF01-01 全生命周期性能管理 - 云架构中心

、可测量的性能目标。若要设置这些目标，需要充分了解业务要求以及预期将提供的服务质量。需要与业务利益干系人共同关键功能的体验要求，而不是只关注技术指标。通过明确地说明性能需求来控制性能，说明要足够明确，以便可以定量地确定软件系统是否满足该目标。具体要求：定义明确的性能需求目标避免使用定性的、模糊的性能目标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
OPS03-01 推行开发者测试 - 云架构中心

赖低，也是在软件系统运维之前成本最低的发现软件问题的方式，尤其是各种异常场景或者用户输入，开发者测试的过程实际上“强制”了开发者去思考线上业务可能出现的场景，从而有利于减轻后续运维阶段系统的负担。此外，云上的软件是不断演进和重构的，很多时候我们不敢修改已有系统代码的原因，就是不

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
SEC07-01 识别工作负载内的数据 - 云架构中心

识别工作负载内的数据通过业务流程、数据流动方向、数据分布、数据的所有者等维度，对照合规要求评估数据的敏感度，对数据分级分类。风险等级高关键策略遵循以下步骤梳理、识别数据：业务流程分析。了解业务流程，对照业务流程图，明确在各个环节中产生、处理和存储的数据类型和用途。与业务部门、开发

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 数据安全与隐私保护 > SEC07 通用数据安全
RES01-03 云服务器反亲和 - 云架构中心

云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ECS，需要配置主机组反亲和，从而可以将相同业务的ECS调度到不同物理服务器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置。演练结束后，建议针对故障中的发现、响应、恢复三个阶段的时长和操作内容进行复盘，并梳理改进点进行优化，提升业务系统的稳定性。父主题： RES11

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
SEC05-02 实施漏洞管理 - 云架构中心

漏洞管理有助于及时发现并修复系统中存在的安全漏洞，防范潜在的安全威胁和攻击。安全漏洞可能使他人非法获得系统访问特权，应通过可信渠道获取最新的安全情报。风险等级高关键策略安全漏洞可通过及时安装安全补丁的方式修复漏洞，以防恶意个人或软件非法利用从而破坏业务系统和数据。通过及时了解最

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
OPS01-01 建立持续学习和改进的文化 - 云架构中心

OPS01-01 建立持续学习和改进的文化风险等级高关键策略由于系统的独特性和复杂性，没有放之四海皆准的方案，为了达到卓越运营，需要不断改进这些最佳实践，并建立自己的最佳实践。所以，在所有最佳实践的第一条，就是在您的团队中培养持续学习和改进的文化。而持续学习和改进需要鼓

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
COST02-01 建立云预算与预测流程 - 云架构中心

COST02-01 建立云预算与预测流程风险等级高关键策略由于云资源天然的易申请，易缩扩容的特性，使用云可以提高效率、创新速度和灵活性，与此同时，也导致了云成本和使用模式的高度可变，客户应调整现有的组织预算和预测流程，以适应云的变化。客户应密切关注历史消费趋势和不断变化的业务趋势，力求

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST02 实施预算规划管理机制
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。恢复：至少部署2个后端BMS。对于无状态业务，配置ELB弹性负载均衡保障业务可靠性；对于有状态业务，由应用层实现多实例高可用。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
RES03-04 支持容灾管理 - 云架构中心

异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。典型亚健康故障场景，支持业务降级或主动切换，业务不持续受损。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库

总条数： 381

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是应用韧性 - 云架构中心

COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

常见故障模式 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

RES13-04 支持主动扩容 - 云架构中心

缓存性能优化 - 云架构中心

RES01-02 应用组件多位置部署 - 云架构中心

Serverless性能优化 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

OPS03-01 推行开发者测试 - 云架构中心

SEC07-01 识别工作负载内的数据 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

常见故障模式 - 云架构中心

SEC05-02 实施漏洞管理 - 云架构中心

OPS01-01 建立持续学习和改进的文化 - 云架构中心

COST02-01 建立云预算与预测流程 - 云架构中心

常见故障模式 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线