搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
OPS06-02 定义可观测对象 - 云架构中心

对接、线下自建 Prometheus 对接、业务监控、应用监控、线下 IDC 监控和线下中间件监控网络性能管理监控功能：对客户端 - 网 - 边 - 云全链路网络进行监控，帮助用户及时发现网络故障，全面掌握网络的实时状况。主要关注：应用响应时间、DNS 解析时间、TCP 建连时间、访问流量等指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS06-05 实施依赖项遥测 - 云架构中心

OPS06-05 实施依赖项遥测风险等级高关键策略依赖项遥测可以监控工作负载所依赖的外部服务和组件的运行状况及性能。提供有关与 DNS、数据库或第三方 API 等依赖项相关的可访问性、超时及其他关键事件的高价值指标采集。当对应用程序进行检测，以发布有关这些依赖项的指标、日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES01-03 云服务器反亲和 - 云架构中心

RES01-03 云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ESC，需要配置主机组反亲和，从而可以将相同业务的ECS调

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES15-02 自动化检查 - 云架构中心

RES15-02 自动化检查在部署或升级过程中集成基本测试功能，实现自动化检查，无需人工参与。风险等级高关键策略在部署或升级过程中集成基本测试功能，在部署或升级完成后自动进行检查和测试，以验证新部署的代码功能是否正确。在部署或升级过程中集成故障注入测试功能，在部署或升

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES15-04 灰度部署和升级 - 云架构中心

RES15-04 灰度部署和升级原地升级和回滚时，升级和回滚过程中业务将会中断，中断时长受限于升级和回滚的时长，对业务影响比较大；而采用灰度部署和升级，可减少升级和回滚过程中的业务中断，提升系统可用性。风险等级高关键策略通过金丝雀部署、蓝绿部署等方式实现灰度升级或部署，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
SEC06-04 应用安全配置 - 云架构中心

SEC06-04 应用安全配置对应用运行时的各项配置进行加固，以避免因安全配置错误而产生的安全漏洞和风险。风险等级高关键策略根据安全配置规范，对您工作负载中的应用，如Nginx、Tomcat、Apache、Jetty、JBoss、PHP、Redis等完成安全配置加固和Web攻击防护。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
SEC10-01 建立安全响应团队 - 云架构中心

SEC10-01 建立安全响应团队建立安全事件响应团队，明确各角色与职责。风险等级高关键策略安全事件响应团队一般包含如下角色及职责：安全响应专家：主导网络安全事件调查，负责对事件进行定级、通报、攻击溯源以及确定影响范围，制定应急处置措施，推动服务控制风险。攻击溯源专

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink性能优化概述 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS05-03 定义变更流程 - 云架构中心

OPS05-03 定义变更流程风险等级高关键策略在建立标准的变更管理流程前，清晰明白变更各个流程的定义：变更发起：在变更发起前，需明确变更内容与变更原因等信息。信息的明确可减轻变更评估人的工作量，同时明确变更的意义。变更信息包括：基本信息：标题、时间、变更人、原因等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS06-04 规范化应用日志 - 云架构中心

OPS06-04 规范化应用日志日志是随时间推移发生的不可变、记录时间戳的离散事件。系统需要记录关键事件和故障，以帮助诊断问题和解决故障。风险等级高关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES14-01 变更防呆检查 - 云架构中心

RES14-01 变更防呆检查防呆是一种预防矫正的行为约束手段，运用防止错误发生的限制方法，让操作者不需要花费注意力、也不需要经验与专业知识，凭借直觉即可准确无误地完成的操作。风险等级高关键策略通过以下约束和检查，可减少配置差错：角色约束：通过权限控制设计预防对不同角

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES14-03 变更前数据备份 - 云架构中心

RES14-03 变更前数据备份通过配置数据事前备份与恢复设计，确保在出现配置错误时能够快速恢复到正确的配置数据状态。风险等级高关键策略进行全量数据备份，以防变更过程中数据被破坏，影响业务。异常回滚时，可使用备份数据进行恢复。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES01-02 应用组件多位置部署 - 云架构中心

RES01-02 应用组件多位置部署应用组件需要部署在多个数据中心，以避免单个数据中心故障而导致业务中断。风险等级高关键策略可根据不同需求，将应用的数据和资源部署在多个位置：应用多AZ部署：应用应尽可能部署在多个可用区，避免由于单个可用区故障而导致所有业务中断。应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-01 组建应急恢复团队 - 云架构中心

RES12-01 组建应急恢复团队为了应对紧急故障场景，需要组建应急恢复团队，明确责任人，并进行培训。风险等级高关键策略组建应急恢复团队：其中包括应急恢复主席及所有组件及关键依赖项的恢复责任人。应急恢复主席：在出现问题后及时组织应急恢复团队进行快速恢复处理。组件或关

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理

总条数： 381

上一页
1
...
13
14
15
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

OPS06-05 实施依赖项遥测 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

RES15-02 自动化检查 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

SEC06-04 应用安全配置 - 云架构中心

SEC10-01 建立安全响应团队 - 云架构中心

Flink性能优化 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

RES14-01 变更防呆检查 - 云架构中心

RES14-03 变更前数据备份 - 云架构中心

RES01-02 应用组件多位置部署 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

RES11-03 长稳测试 - 云架构中心

RES12-01 组建应急恢复团队 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线