搜索_华为云

PERF06-03 自动告警 - 云架构中心

PERF06-03 自动告警风险等级中关键策略通过在云监控平台配置对应的告警策略，可以及时了解资源风险，以便做出对应调整和策略。相关云服务和工具：优化顾问 OA 云监控服务 CES 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
OPS07-04 支持故障恢复流程 - 云架构中心

现、故障定位、故障恢复、故障复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长（MTTR）的长效收敛，实现故障的快速恢复。设计建议父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

度，设置JobManager的内存，TaskManager的数量，TaskManager的内存，每个TaskManager的slot数量，规划适当的CPU核数和内存大小。在规划内存时，要预留一定量的内存空间作为操作系统的buffer cache，一般预留20%。从HDFS中读

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
COST08-01 按地域规划应用架构 - 云架构中心

国家已启动“东数西算”工程，将东部发达地区的数据，传输到西部算力资源丰富的地区进行运算、存储。西部数据中心综合成本有明显优势，低PUE低能耗，如贵阳资源价格比广州上海等区域低10%左右。企业可将灾备、离线分析、转码、运维等对网络要求低的系统部署在贵阳、乌兰察布，降低资源成本。可以关注华为云新推出的云区域以及相关的服务，考虑多Region部署方案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
OPS05-03 定义变更流程 - 云架构中心

确保执行变更的是与变更内容相关的技术人员，从而确保变更的准确执行。变更验证：在变更完成后，对变更对象与变更内容进行检查，确保变更并未影响实际业务，检查完成后，发布变更结果。变更关闭：在变更完成后，关闭变更任务。对变更记录进行留存，便于后续变更数据的运营与分析。设计建议父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS06-04 规范化应用日志 - 云架构中心

日志是随时间推移发生的不可变、记录时间戳的离散事件。系统需要记录关键事件和故障，以帮助诊断问题和解决故障。风险等级高关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，日志记录是可观测性设计中最基本的需求之一。通

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES03-01 集群跨AZ部署 - 云架构中心

灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其跨AZ高可用能力，即在一个AZ故障的情况下，是否能自动故障转移到另外一个AZ，进行业务恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES12-03 定期应急恢复演练 - 云架构中心

定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES13-01 采用自动弹性扩缩容 - 云架构中心

弹性扩缩容需要通过业务处理逻辑与数据分离、状态外置等技术手段支撑系统处理能力的快速增加或减少。系统扩容和缩容的处理方式有两种，一种是改变单机的处理能力，包括CPU、内存、存储等，称之为纵向伸缩；另一种是单机节点处理能力不变，通过增加节点的数量来改变系统的处理能力，称之为横向伸缩。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES14-01 变更防呆检查 - 云架构中心

变更防呆检查防呆是一种预防矫正的行为约束手段，运用防止错误发生的限制方法，让操作者不需要花费注意力、也不需要经验与专业知识，凭借直觉即可准确无误地完成的操作。风险等级高关键策略通过以下约束和检查，可减少配置差错：角色约束：通过权限控制设计预防对不同角色的配置范围进行约束，避免越权配置导致错误。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES14-03 变更前数据备份 - 云架构中心

RES14-03 变更前数据备份通过配置数据事前备份与恢复设计，确保在出现配置错误时能够快速恢复到正确的配置数据状态。风险等级高关键策略进行全量数据备份，以防变更过程中数据被破坏，影响业务。异常回滚时，可使用备份数据进行恢复。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES01-01 应用组件高可用部署 - 云架构中心

或中断。对已部署的应用系统，改造为支持高可用能力的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其高可用能力，即在其故障的情况下，是否能自动故障转移，进行业务恢复。针对未支持高可用的关键组件，进行如下优化处理：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES03-02 跨AZ数据同步 - 云架构中心

针对有状态业务，需要进行跨AZ的数据同步，以便在一个AZ故障的情况下，数据不丢失；对于无状态业务不涉及。风险等级高关键策略当应用组件对应的云服务实例支持跨AZ高可用实例时，可采用云服务实例自身的跨AZ数据同步；如RDS数据库、DCS实例、OBS桶等。当应用组件对应的云服务实例不支持跨

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

通过红蓝攻防，可以模拟各种复杂的攻击场景，帮助全面评估应用韧性，及时发现并解决潜在风险。风险等级高关键策略蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置。演练结束后，建议针对故障中的发现、响应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES14-02 自动化变更 - 云架构中心

采取相应的措施进行风险管理。自动化测试和验证：验证变更的正确性以及性能、可靠性影响，减少人工测试的错误和延迟。监控和审计变更过程：追踪和记录变更执行情况，及时发现和解决问题，提供透明度和可追溯性。相关云服务和工具云运维中心 COC：作业管理：提供用户自定义作业的创建、修

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当GaussDB(for MySQL)实例由于过载导致网络限制时，可参考“RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高”的处理。父主题： GaussDB(for MySQL)云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
SEC10-04 安全事件演练 - 云架构中心

y攻击的占比增加、社工手段的多样性增加，大部分攻击都是内网渗透、正面入侵很少。整体攻击战法更贴近于真实的网络入侵，符合“以攻促防”的目标。防守要点变化：从单点防护开始转变为多点协同防护；从大范围的黑名单拦截转变为有技巧性的联动防护；从边界的纵深拦截延伸到内网的异常监控；从被动的监控防御延伸到主动的诱捕溯源。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

集群服务部署规划服务规模与业务容量参数配置对照表 Spark作为内存计算引擎，需要更多的内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：当程序运行在yarn-client模式下时，需要关注在driver端汇聚的数据量大小，根

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
COST05-03 定期回顾和审核 - 云架构中心

及相应的成本是否带来正向的营收。回顾和审核的频率应该综合考虑多种因素，包括成本优化在企业或者组织中的重要性，测试和验证成本，应用的复杂性和优化变更的难易程度。同时，在每次回顾和审核时，持续改进流程，例如，通过降低测试和变更的成本从而提升整体的优化频率。最后，在云厂商新的服务、资

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标

总条数： 381

上一页
1
...
14
15
16
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

PERF06-03 自动告警 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

Flink性能优化 - 云架构中心

COST08-01 按地域规划应用架构 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

RES14-01 变更防呆检查 - 云架构中心

RES14-03 变更前数据备份 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES03-02 跨AZ数据同步 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

RES14-02 自动化变更 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

SEC10-04 安全事件演练 - 云架构中心

Spark性能优化 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线