搜索_华为云

OPS04-04 自动化工程运维任务 - 云架构中心

为错误。为了最大限度地提高自动化投资的价值，优先考虑简单、程序化且长期的任务。应用自动化并不是一种全有或全无的策略。即使需要人工干预的工作流(例: 决策点)，也可以从自动化中受益。风险等级高关键策略优先考虑从自动化中受益最多的任务：专注于高度程序化且容易出现人为错误的任

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

故障中断：假定每年故障中断4次，每次应急恢复决策时长为30分钟，恢复处理时长为30分钟，则每年故障中断时长为240分钟。变更中断：假定应用离线更新，每年更新8次，每次更新时长30分钟，则每年更新时长为240分钟。按照以上评估，每年应用系统不可用的时长是480分钟，满足可用设计目标要求。内部知识管

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pipeline处理数据，时延毫秒级，且兼具可靠性。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

度评审不应该只是在产品刚上线时进行审查，而以后则置之不理。由于您的云上应用不断更新，这个流程应该定期/或者由重大事件（比如电商企业的促销）触发。此外还有类似于企业IT服务的管理，账号的管理等流程，围绕这些流程，您的企业可以使用并标准化一系列云上工具，如流水线，监控报警，日志处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
电商类应用典型部署架构（99.99%） - 云架构中心

标通常要求达到99.99%，即每年故障时间可以为52.56分钟。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断3次，每次应急恢复决策时长为10分钟，恢复处理时长为5分钟，则每年故障中断时长为45分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
SEC10-02 制定事件响应计划 - 云架构中心

定期审查和更新事件响应计划，以适应新的威胁和业务需求。事件级别事件及时响应时间平均风险控制时间 S1事件 5分钟 1小时 S2事件 5分钟 2小时 S3事件 5分钟 4小时 S4事件 10分钟 24小时 S5事件 10分账 48小时父主题： SEC10 安全事件响应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES13-03 过载检测与流量控制 - 云架构中心

故障（包括过载）而失败，停止调用远程资源和服务，避免故障扩散。相关云服务和工具华为云提供了一些内嵌流控保护的云服务，用户可直接配置使用： API网关 APIG：支持配置流控策略，用户可指定单位时间内的单个API、单个用户或单个APP的请求次数上限。微服务引擎 CSE：支持限

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

实时数据传输及完整设备支持：数据丢失趋于0，备用数据系统就绪，远程数据复制，备用网络就绪数分钟至2天 0至30分钟 6 数据零丢失和远程集群支持：数据零丢失，自动系统故障切换，远程磁盘镜像，备用网络active 数分钟 0 父主题：可用性目标定义

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
云堡垒机(CBH) - 云架构中心
云堡垒机(CBH) - 云架构中心

Bastion Host，CBH）是华为云的一款统一安全管控平台，为企业提供集中的账号（Account）、授权（Authorization）、认证（Authentication）和审计（Audit）管理服务。云堡垒机提供云计算安全管控的系统和组件，包含部门、用户、资源、策略、运维、审计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
PERF03-06 选择合适的消息队列 - 云架构中心

会话消息等功能，适用电商、金融场景。 RabbitMQ：兼容开源RabbitMQ，支持广播、事务消息、消息路由、死信队列、优先级队列等，适用于秒杀、流控、系统解耦等场景。详细版本对比可参考官方文档。相关云服务和工具：分布式消息服务Kafka版分布式消息服务RocketMQ版

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
RES05-02 避免暴露不必要的网络地址 - 云架构中心

避免暴露不必要的网络地址网络地址对外暴露时，可能会引入安全风险，需要避免暴露不必要的网络地址。风险等级高关键策略通常对外网络地址需要尽可能集中管控，避免分散暴露，如使用网络服务ELB弹性负载均衡、公网NAT网关、Web云防火墙等作为公网访问入口。对外的IP地址需要通过安全组、NAT等限制网络端口访问，减少安全风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

内部知识管理系统，项目跟踪系统 99.95% 4.38小时客户账户管理，信息管理 99.99% 52.56分钟电商，B2B web服务，大流量媒体/内容网站 99.999% 5.26分钟银行，投资，金融，政府，电信，关键企业应用系统的可用度依赖于系统内各业务单元的可用度。各业务单元之间典型的可靠性模型有两类：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
OPS04-02 采用持续部署模型 - 云架构中心

该提供充足的部署间隔时间（即部署组之间的时间），以确保来自不同区域的用户或执行不同任务的用户有时间使用工作负载。间隔时间应以小时和天而不是分钟来衡量。每个部署组的间隔时间也应该增加，以便考虑不同的时区和使用模式。相关云服务和工具 CodeArts Deploy 父主题： OPS04

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES02-02 自动数据备份 - 云架构中心

时，用户需要根据数据重要性选择合适的备份周期。数据库自动备份：RDS、DDS、GaussDB等数据库服务提供了缺省自动备份功能，实例每5分钟自动进行一次增量备份，以保证数据库的可靠性。 DCS备份：DCS服务针对非单机实例提供了自动备份和手工备份功能，建议设置自动备份策略进行备份。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
DMS分布式消息服务 - 云架构中心

实例。 RabbitMq版：完全兼容开源RabbitMQ，提供即开即用、消息特性丰富、灵活路由、高可用、监控和告警等特性，广泛应用于秒杀、流控、系统解耦等场景。 RocketMQ版：低延迟、弹性高可靠、高吞吐、动态扩展、便捷多样的消息中间件服务。可靠性功能常见故障模式父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
OPS07-03 支持事件管理 - 云架构中心

OPS07-03 支持事件管理风险等级高关键策略事件(incidents)是需要干预的事情。当发生事故(incidents)时，通过流程来处理。如何与团队沟通活动的状态？谁负责响应处置？使用哪些工具来缓解该事件？这些都是流程中需要回答的问题，并需要获得可靠的响应过程。流程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
设计原则 - 云架构中心
设计原则 - 云架构中心

的，有可能造成资源大量浪费，过载设计应该考虑以下方面：动态限流：根据系统资源消耗情况动态调整流控门限。弹性扩缩容：自动检测系统资源利用率，自动进行添加或删除资源。先负载均衡后流控：多个并行处理单元场景下，优先考虑负载均衡，避免单个处理单元资源受限导致业务受损；然后进行过载控制保护，使得整个系统的处理能力最大化。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
PERF04-02 选择合适的测试方式 - 云架构中心

负载测试：是在被测系统上进行负载阶梯加载，直至摸到系统性能极限，一般用来测试系统性能容量或调优。压力测试：是检查系统处于超负载压力下的性能表现，可以考察系统的流控机制和极限场景下的性能。长时间稳定性测试：该测试需要在负载压力下进行，是考察性能表现稳定性的重要手段，经常结合压力测试开展。配置测试：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
RES06-02 面向所有故障进行检测 - 云架构中心

业务检测使用拨测技术来完成检测，由于拨测需要占用网络资源，对于长周期拨测，一般选择在空闲时间段进行，属于抽样检测，而如果是短周期拨测（如5分钟周期），则可例行进行；与功能检测的联系是，业务检测也可以采用调用链来完成。故障检测方法根据类型有很多种，下面是一些在高可用性系统中常用的故障检测方法。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
OPS04-03 基础设施即代码 - 云架构中心

OPS04-03 基础设施即代码基础设施即代码（IaC）是指使用代码而不是手动流程来管控基础设施的能力。应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程

总条数： 84

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS04-04 自动化工程运维任务 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

Flink性能优化 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

电商类应用典型部署架构（99.99%） - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

RTO与RPO - 云架构中心

云堡垒机(CBH) - 云架构中心

PERF03-06 选择合适的消息队列 - 云架构中心

RES05-02 避免暴露不必要的网络地址 - 云架构中心

可用度及SLO - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

RES02-02 自动数据备份 - 云架构中心

DMS分布式消息服务 - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

设计原则 - 云架构中心

PERF04-02 选择合适的测试方式 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线