搜索_华为云

设计原则 - 云架构中心
设计原则 - 云架构中心

分层保护：系统故障保护要考虑网络分层，下层的故障保护倒换要比上层灵敏，防止系统出现乒乓倒换。通过检测系统运行状态，或监控系统载关键指标，来判断系统是否发生故障，并针对故障可进行自动恢复处理。可以通过故障分析方法分析各种故障模式、影响及危害，设计对应的可靠可用方案，提供冗余、隔

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
PERF04-06 建立性能可观测性体系 - 云架构中心

除等功能的一套完整的解决方案。性能可观测体系在此基础上突出了性能指标，通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。性能监控对象：服务器、操作系统、数据库、应用程序、网络设备、云服务。常见性能指标：包括资源CPU、内存，硬盘等，及程序的响应时间、吞吐量、并发数等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
OPS06-01 建立可观测性体系 - 云架构中心

可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

串联模型：组成系统的所有单元中任一单元的故障都会导致整个系统故障的称为串联系统。可靠性数学模型：举例：假定系统存在2个串联单元，每个单元的可用度均为99.9%，则系统可用度为 Rs = 99.9% * 99.9% = 99.8%。串联系统中系统可用度低于串联系统中任一单元的可用度。为提高系统可用度，设计时需考虑：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
RES07-03 监控到异常后发送消息通知 - 云架构中心

RES07-03 监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份，避免单点风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
概念表 - 云架构中心
概念表 - 云架构中心

工程的目标除了提高可靠性外，还包括提高从故障中恢复运行能力，即维修性（maintainability），同时还包括其他围绕故障展开的各种能力，如可用性（availability）、保障性（supportability）等。因此，从广义韧性与广义可靠性的定义来看，并没有显著区别。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
SEC06-05 执行渗透测试 - 云架构中心

通过模拟真实的攻击场景来评估系统、应用程序或网络的安全性。渗透测试旨在发现系统中的安全漏洞、弱点和潜在的安全风险，以帮助组织改进其安全措施、加固防御，并保护系统免受真实攻击的威胁。风险等级高关键策略建议在开发周期的后期执行渗透测试，使系统功能接近预期发布状态，但也要留有足够的时间来解决发现的问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
SEC05-05 证书安全管理 - 云架构中心

SEC05-05 证书安全管理证书的常见用途包括传输数据的加密和系统间的身份认证场景。集中管理每个证书的用途、有效期等信息，并及时对证书替换。风险等级中关键策略集中管理证书：建立中心化的证书管理系统，用于存储、跟踪和管理所有证书。确保每个证书都有清晰的标识，包括用途、所有者、有效期等信息。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

跨云双活方案当重要应用系统已经在IDC或其他云上部署，并需在华为云上部署一套系统实现双活，以提供高可用的容灾方案。假定应用系统在IDC或其他云上可以达到99.9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
OPS06-02 定义可观测对象 - 云架构中心

应用层、中间件层以及基础设施层告警信息，同时通过绑定当前应用的仪表盘，以图表的形式展示指标源、日志源以及系统图表信息。主要关注：WAITING 状态线程数、TIMED_WAITING 状态线程数、可使用内存等指标进程监控进程监控是针对主机内活跃进程进行的监控，默认采集活跃进程消耗的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
双Region方案 - 云架构中心
双Region方案 - 云架构中心

进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库/虚拟机的分层部署架构。应用系统在主备Region各部署一套完整系统，主备Region间数据同步；Region内跨AZ高可用部署，提供同城跨数据中心双活能力；

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES01-01 应用组件高可用部署 - 云架构中心

业务自动恢复的功能，并能容忍虚拟机HA期间业务处理性能短暂下降或中断。对已部署的应用系统，改造为支持高可用能力的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其高可用能力，即在其故障的情况下，是否能自动故障转移，进行业务恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
SEC05-02 实施漏洞管理 - 云架构中心

漏洞管理有助于及时发现并修复系统中存在的安全漏洞，防范潜在的安全威胁和攻击。安全漏洞可能使他人非法获得系统访问特权，应通过可信渠道获取最新的安全情报。风险等级高关键策略安全漏洞可通过及时安装安全补丁的方式修复漏洞，以防恶意个人或软件非法利用从而破坏业务系统和数据。通过及时了解最

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
PERF02-02 容量规划 - 云架构中心

确定系统所需的计算资源、存储资源和网络带宽等资源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，例如需要存储大量的数据，可能需要选择分布式存储系统。网络

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成功处理的控制过程；典型过载控制方法定义如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
OPS06-04 规范化应用日志 - 云架构中心

OPS06-04 规范化应用日志日志是随时间推移发生的不可变、记录时间戳的离散事件。系统需要记录关键事件和故障，以帮助诊断问题和解决故障。风险等级高关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，日志记录是可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS06-06 实施分布式跟踪 - 云架构中心

编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时，标识符将被添加

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES06-01 故障模式分析 - 云架构中心

严酷度是度量故障给系统造成的最坏潜在后果，一般分为四个等级：Ⅰ类（严重）、Ⅱ类（较严重）、Ⅲ类（一般）、Ⅳ类（轻微）。 I类：这种故障会导致整个系统崩溃或主要功能受到严重影响； II类：这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患； III类：系统次要功能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
可用性需求 - 云架构中心
可用性需求 - 云架构中心

根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的可用性目标明

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念

总条数： 207

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

设计原则 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

可用度及SLO - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

概念表 - 云架构中心

RES11-03 长稳测试 - 云架构中心

SEC06-05 执行渗透测试 - 云架构中心

SEC05-05 证书安全管理 - 云架构中心

跨云双活方案 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

双Region方案 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

SEC05-02 实施漏洞管理 - 云架构中心

PERF02-02 容量规划 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

可用性需求 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线