搜索_华为云

OPS06-01 建立可观测性体系 - 云架构中心

复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程就越快速越准确，而无需进行额外的测试或编码。风险等级高关键策略可观测体系是围绕确定性恢复命题展开的，决定了确定性恢复能力构建与 SLO 达成。可观测体系能够直接决定一些故障的恢复时长，如下图所示，MTTR

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS04-02 采用持续部署模型 - 云架构中心

色实例时，引流是渐进的。完成转出后，更新实例将变为蓝色实例，绿色实例已准备好进行下一次部署。这两个实例在逻辑上彼此分离，以防止发生故障。风险等级高关键策略选择这两种模型时，部署的每个阶段之间的时间应该足够长，以便能够监控工作负载的运行状况指标。应该提供充足的部署间隔时间（

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
卓越架构技术框架简介 - 云架构中心

环境、不断增加的“技术债务”、有限的技能以及安全风险等，这些问题都将成为企业无法快速创新和实现业务目标的潜在风险。卓越架构技术框架（Well-Architected Framework）将为企业提供优化建议，企业结合实施策略，有选择有节奏的优化应用，以提升存量应用的韧性、安全性、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践
设计原则 - 云架构中心
设计原则 - 云架构中心

检测范围：识别并跟踪检测所有组件，有重大影响的故障模式需要重点检测。亚健康检测：对不引起系统故障却导致系统或服务KPI下降的亚健康异常需要能检测，如网络时延变大、磁盘变慢、内存泄露等亚健康故障。备用检测：冗余系统中，主备用模块的故障都需要检测，避免静默故障。有特殊寿命器件：应及时监控有特殊寿命（如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
软件开发生产线(CodeArts） - 云架构中心

流水线：提供可视化、可定制的持续交付流水线服务，实现缩短交付周期和提升交付质量的效果。代码检查：为用户提供代码风格、通用质量与网络安全风险等丰富的检查能力，提供全面质量报告、便捷的问题闭环处理帮助企业有效管控代码质量，助力企业成功。编译构建：基于云端大规模分布式加速，为客户

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES06-01 故障模式分析 - 云架构中心

错等类型的故障，更需要充分分析并提供检测和恢复措施。风险等级高关键策略针对每种故障模式，分析其发生的频率以及造成的影响，以确定严酷度等级。对于存在单点故障的组件对应的故障模式，严酷度必须设置为高。云服务通用的故障模式有：CPU过载、内存过载、磁盘使用率过高、数据故障(被误删等)、AZ故障、Region故障等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
设计原则 - 云架构中心
设计原则 - 云架构中心

如释放空闲资源的流程。企业也可以定期生成报告，并同步给干系人；同时联席例会，如组织多角色参与的例会(如月度例会)，审视预算执行情况、讨论风险应对策略、总结优化经验和计划下一步重点工作等；事前规划，做好成本模型，预算规划和成本预测理解每个组织，项目的成本并非易事，尤其是很多云

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
基础概念 - 云架构中心
基础概念 - 云架构中心

Identify）平均发现时长、MTTK（Mean Time to Know）平均诊断时长、MTTF（Mean Time to Fix）平均修复时长变更风险控制在变更作业过程中，建立事前检查、事中拦截和事后验证的能力，防止异常行为。安全生产安全生产目的是为了持续保障现网“安全、稳定、高质

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

HDFS：最底层的IO读也是性能的关键，主要考虑的指标是读取和写入的性能，还包括块大小合理设置等。其中MapReduce/Spark/HDFS组件有自己独立的调优手册及文档，请参考对应组件的调优。本文档重点讨论上述的1，2，3部分的性能调优的内容，并结合MapReduce/Spark的进行调优说明。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
设计原则 - 云架构中心
设计原则 - 云架构中心

目的管理，而是从运维角度来看，小型频发的迭代有助于快速发现问题，一旦发现问题，也易于回滚到软件的上一版本，并降低部署失败时发生大规模问题的风险。 X即代码，尽量自动化所有流程云上应用和传统应用的一大区别是，您可以将整个云上应用，包含应用程序自身、运行应用的云基础设施、安全策略、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

账号，基础设施OU下面创建用于网络运营、运维监控、公共服务和沙箱测试的账号。下表是这些IT职能账号的详细说明。除了上述账号之外，每个组织有且仅有一个管理账号，管理账号不建议部署任何云资源，主要是做好以下管理工作：统一组织和账号管理：创建和管理组织结构和组织单元，在组织单元下面

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

便在病毒入侵、人为误删除、软硬件故障等场景，能够快速将数据恢复到备份点。由于容灾通常对数据采用实时复制且没有多备份点，在主数据被误删或误改的情况下，错误数据会同步到备端，从而无法达到数据备份的效果，因此通常不能使用容灾来代替备份。备份恢复时的RPO指标（即数据丢失量），与最近

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
单Region方案 - 云架构中心
单Region方案 - 云架构中心

在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库的分层部署架构。该应用系统在华为云一个Region两个AZ中各部署一套，提供同城容灾能力。接入层（外部GSLB）：通过外部GS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
双Region方案 - 云架构中心
双Region方案 - 云架构中心

在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库/虚拟机的分层部署架构。应用系统在主备Region各部署一套完整系统，主备Region间数据同步；Region内跨AZ高可用部署

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
Serverless性能优化 - 云架构中心

但是初始化完成后每次执行的时延相较其他解释型语言（NodeJs，Python等）会有一定优势。如果流量不均衡，且对冷启动时延或者最大时延有一定要求的业务使用NodeJs, Python等运行时语言，如果流量比较均衡或者对最大时延不敏感，但是对平均时延敏感的业务选择Java，Go等编译型语言。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
性能效率支柱简介 - 云架构中心

一些技术方法和手段，这些方法手段可以用于系统的软件性能工程建设，也可用于指导性能调整和优化。早期的设计决策会对性能调节能否成功，以及是否有必要进行性能调节产生重要影响。如果开发的软件对性能非常敏感，实际上需要从设计阶段和开发周期的第一天起就考虑性能管理的问题，即采取系统的主动性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
数据持久度 - 云架构中心
数据持久度 - 云架构中心

存储系统的可靠性。其只表示数据是否丢失的概率，不体现数据丢失多少；数据持久度的预计周期，一般按一年进行预计。影响存储数据持久度的主要因子有：冗余数、磁盘失效率与数据修复时间。其中每多一个冗余，数据持久度通常可增加2~3个9；云上常用的对象存储，一般采用3副本冗余，通常可提供11~12个9的数据持久度。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

用部署。备份 RDS、DDS数据库自动备份，有状态ECS通过CBR自动备份，在数据故障时使用最新备份数据恢复，可以满足可用性目标要求。容灾应用使用支持跨AZ的服务进行跨AZ部署，ELB、RDS跨AZ部署，AZ故障时自动恢复。有状态ECS通过SDRS进行跨AZ容灾，在AZ故障时手工切换。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

您是否通过CI/CD实现高效的频繁可逆的小规模变更？ 1. 进行需求管理与迭代开发 2. 关联源代码版本和部署的应用版本，使用代码质量最佳实践 OPS03 你是否有完备的测试验证体系？ 1. 推行开发者测试 2. 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 3. 性能压测 4. 生产环境拔测

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。恢复：至少部署2个后端BMS。对于无状态业务，配置ELB弹性负载均衡保障业务可靠性；对于有状态业务，由应用层实现多实例高可用。应用层进行重试，以应对暂时性故障，如网络过载时；应用故障重试处理可参考“故障重试”。当BMS由于过载导致网络限制时，可参考“BMS的CPU

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务

总条数： 232

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS06-01 建立可观测性体系 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

卓越架构技术框架简介 - 云架构中心

设计原则 - 云架构中心

软件开发生产线(CodeArts） - 云架构中心

RES06-01 故障模式分析 - 云架构中心

设计原则 - 云架构中心

基础概念 - 云架构中心

HIVE优化 - 云架构中心

设计原则 - 云架构中心

组织级参考架构 - 云架构中心

RES02 备份 - 云架构中心

单Region方案 - 云架构中心

双Region方案 - 云架构中心

Serverless性能优化 - 云架构中心

性能效率支柱简介 - 云架构中心

数据持久度 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

问题和检查项 - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线