搜索_华为云

云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过变更日历实现变更冲突检测，降低服务间变更依赖导致的变更风险。实施保障：按预定方案执行变更，变更步骤标准化、可观测，变更异常及时介入处理，实现变更实施全过程可控、可视、可管。确定性故障管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01 集群跨AZ部署 RES03-02 跨AZ数据同步 RES03-03 对接容灾仲裁，支持自动切换 RES03-04 支持容灾管理父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES03-01 集群跨AZ部署 - 云架构中心

或ELB跨AZ负载均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自动化容灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

有效落地持续集成 2. 采用持续部署模型 3. 基础设施即代码 4. 自动化工程运维任务 OPS05 是否有运维准备和变更管理体系？ 1. 进行生产准备度评审 2. 进行变更风控 3. 定义变更流程 OPS06 是否建立了完备的可观测体系？ 1.建立可观测体系 2.定义可观测对象 3.制定和实施可观测性指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
卓越运营支柱 - 云架构中心
卓越运营支柱 - 云架构中心

建立持续改进的团队文化和标准化的运维体系 OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS03 完备的测试验证体系 OPS04 自动化构建和部署流程 OPS05 运维准备和变更管理 OPS06 可观测性体系 OPS07 进行故障分析和管理 OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能够快速地从MapReduce切换到Spark计算平台上去。Spark提供一站式数据分析能力，包括小批量流式处理、离线批处理、SQL查询、数据挖掘等，用户可以在同一个应用中无缝结合使用这些能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

IDC或其他云出现故障时可以快速切换到华为云。监控告警进行站点运行状态检查，在发生故障时告警；针对CCE、DCS、kafka、RDS、DDS等实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容 CCE集群支持工作负载的自动弹性伸缩。变更防差错软件更新采用金丝雀或蓝绿

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

RDS数据库提供自动数据备份、跨AZ和跨Region的数据复制与切换。不过，即使应用系统利用云平台能力具有了这些高可用能力，要实现较高的可用性，仍需要构建针对各种偶发故障下的恢复能力，如：由于硬件故障导致的高可用切换或跨AZ切换过程中，导致瞬时链接中断，需要应用系统具备链接中断重试的功能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
概述 - 云架构中心
概述 - 云架构中心

在Region/AZ/IDC或其他云站点发生灾难的情况下的恢复能力监控告警应用系统故障后的检测和告警能力弹性扩缩容应用容量不足时的自动恢复能力变更防差错变更对应用业务中断的影响应急恢复处理应用在故障情况下的应急恢复能力父主题：参考架构

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
双Region方案 - 云架构中心
双Region方案 - 云架构中心

故障时手工将业务流量切换到另一个Region。应用层（负载均衡器、应用软件及虚拟机）：对于无状态应用，通过ELB负载均衡器进行故障检测与负载均衡，并通过AS弹性伸缩服务监控负载进行弹性伸缩；对于有状态应用，通过SDRS服务实现跨云的虚拟机数据复制与容灾切换，并可通过CBR服务进行自动数据备份。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因主备切换时，会导致连接中断，需要客户端重试。实例由于故障重启可能会导致通信中断，如ECS所在物理服务器由于硬件原因

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

问题定位复杂 Web、IOS、安卓、百度小程序、微信小程序等多类端侧日志无法使用同一家厂商工具采集，问题定位分析时，需在多个工具间需来回切换，增加了定位复杂度，且无法自定义日志上报的服务端域名，合规性受到部分用户质疑端侧日志上报慢且易丢失：上报速度小时级，也极易出现丢失，对问

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

IDC或其他云出现故障时可以快速切换到华为云。监控告警进行站点运行状态检查，在发生故障时告警；针对CCE、DCS、kafka、RDS、DDS等实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容 CCE集群支持工作负载的自动弹性伸缩。变更防差错软件更新采用金丝雀或蓝绿

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
COST05-03 定期回顾和审核 - 云架构中心

回顾和审核的频率应该综合考虑多种因素，包括成本优化在企业或者组织中的重要性，测试和验证成本，应用的复杂性和优化变更的难易程度。同时，在每次回顾和审核时，持续改进流程，例如，通过降低测试和变更的成本从而提升整体的优化频率。最后，在云厂商新的服务、资源类型和配置推出后，也可以启动流程，对它们进行评估，以优化您的工作负载成本。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
单Region方案 - 云架构中心
单Region方案 - 云架构中心

E、DCS、kafka、RDS、DDS等实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容 CCE集群支持工作负载的自动弹性伸缩。变更防差错软件更新采用金丝雀或蓝绿部署，部署过程自动完成，在部署过程中出现问题时自动回滚。应急恢复处理制定应急处理机制，指定应急恢复人员

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA ELB采用集群化部署，支持多可用区的同城多活容灾，无缝实时切换。后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
电商类应用典型部署架构（99.99%） - 云架构中心

99.99%，即每年故障时间可以为52.56分钟。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断3次，每次应急恢复决策时长为10分钟，恢复处理时长为5分钟，则每年故障中断时长为45分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
RES01-01 应用组件高可用部署 - 云架构中心

针对未支持高可用的关键组件，进行如下优化处理：若云服务实例为单节点实例，如ECS，则通过申请多个实例承载相同业务，并利用ELB实现负载均衡和自动故障切换，或由应用层实现多实例的自动故障切换能力，来实现高可用。对于不依赖于特殊资源的ECS，支持故障自动恢复功能，在ECS所在物理服务器故障的情况下可以自动在其

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
云日志服务(LTS) - 云架构中心
云日志服务(LTS) - 云架构中心

云日志服务提供多种接入方式实现海量日志接入LTS，支持日志搜索引擎、SQL分析引擎、日志加工引擎，详细请参考下图。端云全场景日志接入：40+云服务、主机/容器、移动端、跨云、多语言SDK、多账号汇聚，满足全场景客户丰富的日志接入需求。海量日志存储搜索：百亿日志秒级搜索，千亿日志迭代搜索，PB级智能冷存储。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍

总条数： 114

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

云运维中心(COC) - 云架构中心

RES03 跨AZ容灾 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

问题和检查项 - 云架构中心

卓越运营支柱 - 云架构中心

常见故障模式 - 云架构中心

Spark性能优化 - 云架构中心

跨云容灾方案 - 云架构中心

什么是应用韧性 - 云架构中心

概述 - 云架构中心

双Region方案 - 云架构中心

RES09 故障重试 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

跨云双活方案 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

单Region方案 - 云架构中心

可靠性功能 - 云架构中心

电商类应用典型部署架构（99.99%） - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

云日志服务(LTS) - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线