搜索_华为云

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RES01-03 云服务器反亲和 - 云架构中心

云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ECS，需要配置主机组反亲和，从而可以将相同业务的ECS调度到不同物理服务器上

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES09-01 API及命令调用需要设计为可重试 - 云架构中心

次重复执行，需要保证重复执行多次的结果不变。风险等级高关键策略应用系统在设计时，应使操作具有幂等性，也就是允许一个操作连续执行两次或多次时，应该与单次调用产生的结果相同，从而保证重试安全；若不支持操作的幂等性，会导致客户端难以重试或重试的处理更复杂。父主题： RES09

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。根据错误响应码进行有针对性的重试；对于临时性故障，如错误码指示为系统繁忙

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
SEC07-02 数据保护控制 - 云架构中心

控制，保护数据的机密性和完整性。风险等级高关键策略实施适当的数据保护措施，如加密和身份验证。管理数据访问权限。了解谁可以访问、修改和删除数据，有助于限制数据访问权限，减少数据泄露风险。验证只有获得授权的用户按照“最小化权限”原则访问数据，确保只有经授权的用户才能执行相关操作。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 数据安全与隐私保护 > SEC07 通用数据安全
PERF05-03 WEB场景资源优化 - 云架构中心

代码优化: 对云服务资源使用的代码进行优化，提高代码执行效率。数据库优化: 对云服务资源使用的数据库进行优化，如索引优化、查询优化等。负载均衡: 使用负载均衡技术，将请求分发到多个云服务资源，提高系统的处理能力。监控和调整: 持续监控云服务资源的性能，根据实际情况进行调整，以保持最佳性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
资源编排服务(RFS) - 云架构中心

资源编排服务是完全支持业界事实标准Terraform（HCL + Provider）的新一代云服务资源终态编排引擎，在应用编排服务(AOS)基础上实现了生态、体验、特性的全新升级；资源编排服务基于业界开放生态HCL语法模板，实现云服务资源的自动化批量构建，帮助用户高效、安全、一致创建、管理和升级云服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
OPS06-03 制定和实施可观测性指标 - 云架构中心

用，例如Prometheus、Grafana、Zabbix等，以及华为云提供的云监控服务CES。这些工具可以定期收集指标，提供可视化的指标报告，并且可以发送警报，以帮助组织及时发现问题。可参考CES的最佳实践，https://support.huaweicloud.com/be

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES11-02 压力负载测试 - 云架构中心

HLS/RTMP/ WEBSOCKET/HTTP-FLV等协议构建的云应用提供性能测试的服务，其支持快速模拟大规模并发用户的业务高峰场景，通过自定义报文内容、时序、多事务组合等复杂场景，帮助用户测试验证业务高峰下的服务表现。父主题： RES11 可靠性测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

当重要应用系统已经在IDC或其他云上部署，并需在华为云上部署一套系统实现双活，以提供高可用的容灾方案。假定应用系统在IDC或其他云上可以达到99.9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用虚拟

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

跨云容灾方案当重要应用系统已经在IDC或其他云上部署，并需要容灾到华为云，以提供高可用的容灾方案。假定应用系统在IDC或其他云上可以达到99.9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用虚拟

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

内部知识管理类应用通常用于内部操作，且在故障时只会对内部员工造成影响，可以承受较长的恢复时间和恢复点，其可用性目标通常要求达到99.9%，即每年中断时间可以为8.76小时。导致业务中断的时间包含故障中断时间及由于升级配置维护等导致的中断时间，假定分别中断时间如下：故障中断：假定每年故障中断4次

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

负载均衡分发时需检查后端节点的负载状态，并根据各节点的负载进行业务分发。在后端节点故障的情况下，需要自动将业务分发给其他健康节点处理，以避免业务失败。相关云服务和工具弹性负载均衡 ELB：支持业务负载均衡处理，还支持后端服务器健康状态检测，自动隔离异常状态的ECS。父主题： RES13

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES15-04 灰度部署和升级 - 云架构中心

金丝雀部署（灰度发布）是将少量客户引导到新版本的做法，通常在单个服务实例（Canary）上运行；当检查到任何行为更改或错误时，可以将Canary中的流量删除，并将用户发回到以前的版本。如果部署成功，则可以继续以期望的速度进行部署，同时监控更改以便发现错误，直到所有部署完成。蓝绿部署与

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
人工智能性能优化 - 云架构中心

请内存的地方，均表现为一个tensor的申请释放）。 tensor的生命周期使用类似智能指针的引用计数方式来管理，且打通了Python与C++的通道，即：一个Python的tensor对象关联一个C++的tensor对象，Python的tensor对象的消失会触发C++的tens

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
OPS07-04 支持故障恢复流程 - 云架构中心

现、故障定位、故障恢复、故障复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长（MTTR）的长效收敛，实现故障的快速恢复。设计建议父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理

总条数： 335

上一页
1
...
12
13
14
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

常见故障模式 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

RES09-01 API及命令调用需要设计为可重试 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

SEC07-02 数据保护控制 - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

资源编排服务(RFS) - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

跨云双活方案 - 云架构中心

跨云容灾方案 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

常见故障模式 - 云架构中心

人工智能性能优化 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线