搜索_华为云

RES01-03 云服务器反亲和 - 云架构中心

RES01-03 云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ESC，需要配置主机组反亲和，从而可以将相同业务的ECS调度到不同物理服务器上

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES05-01 网络连接高可用 - 云架构中心

RES05-01 网络连接高可用应用系统对外提供服务时，需要确保对外网络连接的高可用，避免单个网络连接中断而导致业务不可用。风险等级高关键策略网络链路冗余：网络连接需要支持多路径，以实现高可用能力，以避免在一条网络路径中断的情况下，业务能切换到其他路径继续通信。网络链路快速倒换

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
RES15-02 自动化检查 - 云架构中心

RES15-02 自动化检查在部署或升级过程中集成基本测试功能，实现自动化检查，无需人工参与。风险等级高关键策略在部署或升级过程中集成基本测试功能，在部署或升级完成后自动进行检查和测试，以验证新部署的代码功能是否正确。在部署或升级过程中集成故障注入测试功能，在部署或升级完成后自动注入故障进行测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

HIVE优化概述 Hive架构 Hive提供了Hadoop的SQL能力，主要参考标准的SQL，Hive进行了部分的修改，形成了自己的特有的SQL语法HQL（Hive SQL），更加适合于Hadoop的分布式体系，该SQL目前是Hadoop体系的事实标准。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类型业务提供容灾仲裁

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制当应用系统在资源不足自动扩容时，需要考虑配额的限制，若配额不足，会导致自动扩容失败。风险等级高关键策略华为云为防止资源滥用，限定了各服务资源的配额，对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES07-01 定义关键指标与阈值并监控对资源进行监控时，需要先定义资源的关键指标以及对应的阈值，以便快速有效的发现业务表现和系统状态，以便在异常状态下尽早干预恢复，或定位改进系统缺陷。风险等级中关键策略关键指标需要与系统内工作负载的关键性能指标相关，并能确定为系统性能下降的早期警告信号

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES08-03 减少被依赖项故障的影响 - 云架构中心

RES08-03 减少被依赖项故障的影响被依赖项自身的可用性需要增强，以减少对依赖它的组件的影响。风险等级中关键策略对于被依赖项本身，为减少由于服务故障或运行缓慢对依赖它的组件的影响，需要考虑使用以下技术和原则：减少被依赖项本身的外部依赖。优化性能，减少消息响应时延和负载

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES12-04 出现问题后尽快恢复业务 - 云架构中心

RES12-04 出现问题后尽快恢复业务应用系统出现故障后，需要能尽快发现，尽快响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及时告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES02-03 定期进行备份数据恢复 - 云架构中心

RES02-03 定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建一个测试环境

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES09-03 重试需要避免造成流量压力 - 云架构中心

RES09-03 重试需要避免造成流量压力对于链路闪断等原因导致的临时性故障，客户端进行一定的重试，可取得较好的效果；对于流量过载等原因导致的故障，重试可能会导致情况进一步恶化，因此需要避免这种影响。风险等级高关键策略客户端进行重试处理时，建议：增加指数回退和抖动方法，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
RES10 故障隔离 - 云架构中心
RES10 故障隔离 - 云架构中心

RES10 故障隔离当系统某个单元发生故障时，如果不采取措施，故障可能会大规模扩散，从而造成整个系统失效。故障隔离技术的核心思想是将一个工作负载内的故障影响限制于有限数量的组件内，降低故障影响范围，防止产生级联故障。通过划分故障隔离域，限制工作负载的影响，可有效进行故障隔离。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
RES07-05 端到端跟踪请求消息 - 云架构中心

RES07-05 端到端跟踪请求消息端到端跟踪请求消息的处理流程，便于分析和调试问题，并提高处理性能。风险等级低关键策略消息跟踪需要包含消息处理流程中所有组件，以便跟踪结果完整，从而进行准确分析和定位。相关云服务和工具应用性能管理 APM：支持调用链追踪，能够针对应用的调用情况

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
SEC09-03 实施安全审计 - 云架构中心

对审计日志进行保护并定期备份，避免受到未预期的删除、修改或覆盖。可以同步开启审计日志的文件校验，保障审计文件的完整性，防止文件被篡改。集中管控运维账号访问系统和资源的权限，对系统和资源的访问权限进行细粒度设置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES07-03 监控到异常后发送消息通知 - 云架构中心

RES07-03 监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES05-04 预留IP资源以便扩展及高可用 - 云架构中心

RES05-04 预留IP资源以便扩展及高可用云上网络需要满足可扩展以及高可用需求，以便在云上资源弹性伸缩或业务扩展时，有足够网络资源支撑业务发展。风险等级高关键策略云上网络规划设计应满足以下原则：针对每个Region，根据业务需要规划不同的VPC，每个VPC使用独立的地址空间

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES06 故障检测 - 云架构中心
RES06 故障检测 - 云架构中心

RES06 故障检测 RES06-01 故障模式分析 RES06-02 面向所有故障进行检测 RES06-03 支持亚健康检测父主题：故障全面检测

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

RES13 过载保护当系统流量超过一定阈值后，导致系统处于过载状态时，可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制

总条数： 122

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES01-03 云服务器反亲和 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

RES15-02 自动化检查 - 云架构中心

HIVE优化 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

RES09-03 重试需要避免造成流量压力 - 云架构中心

RES10 故障隔离 - 云架构中心

RES07-05 端到端跟踪请求消息 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

RES05-04 预留IP资源以便扩展及高可用 - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

RES06 故障检测 - 云架构中心

RES13 过载保护 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线