搜索_华为云

RES06-03 支持亚健康检测 - 云架构中心

统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。风险等级高关键策略亚健康检测通常用于根据亚健康症状来预测系统故障，典型的例子是内存泄漏，内存泄漏往往不会立刻导致系统失效，系统首先会因为Swap

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES10-04 健康检查与自动隔离 - 云架构中心

RES10-04 健康检查与自动隔离对应用组件进行健康检查，当发现故障后进行主动隔离，避免故障扩散。风险等级高关键策略对系统内组件需要定期进行健康检查，以判断其状态是否正常。对于异常组件，需要能支持自动隔离，避免对整体业务造成影响。相关云服务和工具弹性负载均衡器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
PERF01-01 全生命周期性能管理 - 云架构中心

PERF01-01 全生命周期性能管理风险等级高关键策略指定性能目标从性能角度来看，最好为性能场景定义具体的、量化的、可测量的性能目标。若要设置这些目标，需要充分了解业务要求以及预期将提供的服务质量。需要与业务利益干系人共同关键功能的体验要求，而不是只关注技术指标。通

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
PERF05-02 通用算法优化 - 云架构中心

PERF05-02 通用算法优化风险等级中关键策略算法优化是提高程序性能的关键，可以通过改进算法的设计和实现方式来提高其效率和性能。以下是一些最佳实践：使用正确的数据结构：选择合适的数据结构可以大辐提高算法的效率。例如，使用哈希表可以快速查找元素，使用数组可以快速访问元素。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 算法优化
COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

COST01-03 明确团队责任，建立和维护成本意识文化风险等级中关键策略成本优化的流程中落实成本意识、都需要明确团队责任。一种比较好的实践是使用一组明确定义的 KPI 指标，提供团队级别的报告，实现成本透明度和成本问责制，这些指标可以包含收益/成本比率，单位商品成本，核心资源利用率等等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
COST05-01 分析业务趋势和优化收益 - 云架构中心

COST05-01 分析业务趋势和优化收益风险等级高关键策略云成本是一个综合工程，也是一个定期审核、回顾和执行的流程，除了考虑优化带来的收益以外，还需要考虑相关成本，例如，因为优化带来的人员和时间成本。为了降低整体成本，优化的工作量必须与潜在的节省额成比例。优化可以从应用占成本的比例考虑。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
COST06-02 为工作负载选择合适的计费模式 - 云架构中心

COST06-02 为工作负载选择合适的计费模式风险等级中关键策略分析工作负载的每个组件。确定组件和资源是长时间运行（应享受承诺折扣，包年包月或购买资源包），还是短时间动态运行（采用 Spot 或按需定价）。使用成本管理工具中的建议对工作负载执行分析，并对这些建议应用业务规则以实现高回报。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST06 使用不同计费模式优化成本
OPS05-02 进行变更风控 - 云架构中心

OPS05-02 进行变更风控风险等级高关键策略根据不同变更场景构建风险控制能力，通过风险数字化度量分析和评估风险影响程度，并采取风险控制措施削减或规避风险，保障变更成功。变更风险指现网各要素增、删、改及状态改变（如版本迭代、配置改变、节点扩缩容等）时引发的业务中断风险及变更失败可能导致的业务受损风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS08-01 使用度量指标衡量运营目标 - 云架构中心

OPS08-01 使用度量指标衡量运营目标风险等级高关键策略定义清晰的运营成功的目标和 KPI，设置基线作为参考点并定期重新评估。与业务领导者和利益相关者确定服务的总体目标。确定各个运营团队的任务以及可能面临的挑战。并明确运营目标的关键绩效指标 (KPI)，可能是客户满意度、TTM、平均问题解决时间等等。根据

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
RES01-02 应用组件多位置部署 - 云架构中心

RES01-02 应用组件多位置部署应用组件需要部署在多个数据中心，以避免单个数据中心故障而导致业务中断。风险等级高关键策略可根据不同需求，将应用的数据和资源部署在多个位置：应用多AZ部署：应用应尽可能部署在多个可用区，避免由于单个可用区故障而导致所有业务中断。应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES10-01 应用控制平面与数据平面隔离 - 云架构中心

应用控制平面与数据平面隔离通常应用的数据平面处理业务，比较重要，可用性要求比较高，而控制平面不直接处理业务，因此其故障时不应该影响业务系统。风险等级高关键策略应用控制平面与数据平面隔离，避免控制系统故障影响业务。数据平面所在业务系统的故障恢复可不依赖控制平面，避免由于控制平面故障而导致业务系统无法恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES12-01 组建应急恢复团队 - 云架构中心

RES12-01 组建应急恢复团队为了应对紧急故障场景，需要组建应急恢复团队，明确责任人，并进行培训。风险等级高关键策略组建应急恢复团队：其中包括应急恢复主席及所有组件及关键依赖项的恢复责任人。应急恢复主席：在出现问题后及时组织应急恢复团队进行快速恢复处理。组件或关

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES12-02 制定应急预案 - 云架构中心

RES12-02 制定应急预案针对常见问题现象，提供标准化的应急恢复指导，以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES01-01 应用组件高可用部署 - 云架构中心

RES01-01 应用组件高可用部署应用系统内的所有组件均需要高可用部署，避免单点故障。风险等级高关键策略应用系统内各组件需要根据其具体能力，采用不同的高可用部署方案：使用原生高可用实例：当云服务既支持单节点资源，又支持主备或集群资源时，应用的关键节点应使用主备或集群

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES01-03 云服务器反亲和 - 云架构中心

应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ECS，需要配置主机组反亲和，从而可以将相同业务的ECS调度到不同物理服务器上，以避免由于单台物理服务器故障而导致所有业务不可用的场景。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES02-03 定期进行备份数据恢复 - 云架构中心

定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建一个测试环境，并使用已有的备份数据进行恢复处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES03-02 跨AZ数据同步 - 云架构中心

RES03-02 跨AZ数据同步针对有状态业务，需要进行跨AZ的数据同步，以便在一个AZ故障的情况下，数据不丢失；对于无状态业务不涉及。风险等级高关键策略当应用组件对应的云服务实例支持跨AZ高可用实例时，可采用云服务实例自身的跨AZ数据同步；如RDS数据库、DCS实例、OBS桶等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES08-02 依赖松耦合 - 云架构中心

个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。风险等级中关键策略组件之间通过消息队列、消息缓存、负载均衡器等交互（即松耦合关系），可一定程度上屏蔽组件的状态变化，防止对其他组件造成影响相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

是否重试；重试有助于客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。根据错误响应码进行有针对性的重试；对于临时性故障，如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试

总条数： 269

上一页
1
...
9
10
11
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES06-03 支持亚健康检测 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

PERF05-02 通用算法优化 - 云架构中心

COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

COST05-01 分析业务趋势和优化收益 - 云架构中心

COST06-02 为工作负载选择合适的计费模式 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

OPS08-01 使用度量指标衡量运营目标 - 云架构中心

RES01-02 应用组件多位置部署 - 云架构中心

RES10-01 应用控制平面与数据平面隔离 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

RES12-01 组建应急恢复团队 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

RES03-02 跨AZ数据同步 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线