搜索_华为云

OPS05-02 进行变更风控 - 云架构中心

措施削减或规避风险，保障变更成功。变更风险指现网各要素增、删、改及状态改变（如版本迭代、配置改变、节点扩缩容等）时引发的业务中断风险及变更失败可能导致的业务受损风险。设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS06-02 定义可观测对象 - 云架构中心

ER 主机监控主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为 ECS自动上报的监控指标，操作系统监控通过在ECS中安装Agent插件，为用户提供服务器的系统级、主动式、细颗粒度监控服务。主要关注：CPU_UTIL、DISK_READ_BYTES_RATE、带外网络流入速率等指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
安全性云服务介绍 - 云架构中心

及机器学习、防御策略自动调优，精确识别各种复杂DDoS攻击，以保护您的业务连续性。威胁检测 Web应用防火墙 WAF：保护网站等Web应用程序免受常见Web攻击，保障业务持续稳定运行，满足合规和监管要求。配置审计 Config：为用户提供全局资源配置的检索，配置历史追溯，以及

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
RES07-01 定义关键指标与阈值并监控 - 云架构中心

以下4个黄金指标，是针对大量分布式监控的经验总结，可以作为业务监控的参考，包括：延迟：注意需要区分请求成功的延迟和请求失败的延迟。流量：对系统业务负荷的监控。错误率：注意区分显示失败（如HTTP 500错误）和隐式失败（如HTTP 200中包含了错误内容）。饱和度：侧重在对系统中最为受限的瓶颈资源的监控。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
双Region方案 - 云架构中心
双Region方案 - 云架构中心

支持业务运行状况、成功指标的检查，在发生故障时告警；支持ECS、DCS、Kafka、RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。 OBS对象上传/下载失败检测：对象上传/下载失败。恢复：应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。当OBS桶由于过载导致网络限制时，可参考“OBS桶流量过载”的处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法写入成功，可将数据写入本地缓存，待服务可用后再写入实例。当实例由于过载导致网络限制时，可参考“CPU

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

给其他所有成员账号使用公共服务管理团队镜像服务IMS、容器镜像服务SWR、弹性文件服务SFS、对象存储服务OBS、自建NTP服务器、自建AD服务器等公共资源安全云脑SecMaster、云审计服务CTS、配置审计Config、企业主机安全HSS、数据安全中心DSC 业务账号

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

进行站点运行状态检查，在发生故障时告警；针对ECS、RDS实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容针对内部用户场景，资源足够，无需自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可根据ECS监控情况随时添加和移除ECS实例来扩展应用系统的服务能力；针

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用虚拟机或容器（以容器为例，华为云采用CCE），后端数据库通常要求采用通用MySQL数据库（华为云采用RDS for MySQL），以实现跨云双活容灾。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
RES12-04 出现问题后尽快恢复业务 - 云架构中心

习等方式，预测系统的风险情况，提前进行预防和处理。在进行应急恢复处理时，通常需要尽快缓解或恢复业务，快速结束业务中断对客户的影响，然后再启动问题定位和修复处理流程，以减少业务中断时间。组织协调：故障发生后，应急恢复主席需要迅速组织相关人员快速恢复业务。应急恢复处理：系统发生

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库/虚拟机的分层部署架构。应用系统在IDC/其他云与华为云

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
选择合适的应用中间件云服务资源 - 云架构中心

选择合适的应用中间件云服务资源华为云提供Kafka、RocketMQ、RabbitMQ三种不同版分布式消息服务，您可根据业务需求和不同版本优势来选择合适的消息队列。 PERF03-06 选择合适的消息队列 PERF03-07 选择合适的Kafka PERF03-08 选择合适的RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当RDS实例由

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如云数据库 TaurusDB实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

RES13 过载保护当系统流量超过一定阈值后，导致系统处于过载状态时，可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
RES03-01 集群跨AZ部署 - 云架构中心

实例时，需要借助其他云服务或应用层实现跨AZ容灾；以ECS为例：对于无状态ECS实例，可利用AS弹性伸缩服务的跨AZ伸缩能力，或ELB跨AZ负载均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

端侧采集工具不统一，不支持自定义域名上报，问题定位复杂 Web、IOS、安卓、百度小程序、微信小程序等多类端侧日志无法使用同一家厂商工具采集，问题定位分析时，需在多个工具间需来回切换，增加了定位复杂度，且无法自定义日志上报的服务端域名，合规性受到部分用户质疑端侧日志上报慢且易丢失：上报速度小时级，也

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

单机和主备扩容只能实现内存、带宽的扩容，无法实现计算性能扩容。生产实例需要选择主备或者集群实例，不能选用单机实例强制 - 主备实例，不建议使用过大的规格。建议 Redis在执行RewriteAOF和BGSAVE的时候，会fork一个进程，过大的内存会导致卡顿具备降级或容灾措施缓存访问失败时，具备降级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护

总条数： 205

上一页
1
...
4
5
6
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS05-02 进行变更风控 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

安全性云服务介绍 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

双Region方案 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

组织级参考架构 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

跨云双活方案 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

跨云容灾方案 - 云架构中心

选择合适的应用中间件云服务资源 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

RES13 过载保护 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

缓存性能优化 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线