搜索_华为云

RES06-03 支持亚健康检测 - 云架构中心

刻导致系统失效，系统首先会因为Swap Memory不足变得运行缓慢，消耗内存量持续增加，因此通过监控实例内的内存占用率，在超过阈值的情况下及时告警，人工介入迅速恢复，可避免造成业务中断。典型的亚健康场景有：通信链路丢包/错包、硬盘性能下降、CPU/内存过载等，当应用系统内组件

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES04 跨Region/跨云容灾 - 云架构中心

为了预防区域级灾难发生，或业务跨云容灾需求，需要构建容灾系统提供较为完善的数据保护与灾难恢复能力，以便在站点级灾难发生时，可以保证生产系统的数据尽可能少的丢失，业务系统能在最短时间内由灾备中心接替，恢复业务系统的正常运行，将损失降到最小。对于跨Region容灾场景，应用系统可在多个R

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES03-01 集群跨AZ部署 - 云架构中心

灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其跨AZ高可用能力，即在一个AZ故障的情况下，是否能自动故障转移到另外一个AZ，进行业务恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

如何管理人机接口和机机接口的身份认证？对账号进行保护安全的登录机制安全管理及使用凭证一体化身份管理 SEC03 如何管理人员和机器的权限？定义权限访问要求按需分配合适的权限定期审视权限安全共享资源 SEC04 如何进行网络安全设计？对网络划分区域控制网络流量的访问网络访问权限最小化

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

识别和备份应用中所有需要备份的关键数据不同数据的重要性不一样，针对应用系统内的所有数据，需要明确其重要性及对应的RPO/RTO指标要求。比如对于重要数据，通常允许数据丢失的时间会比较少，从而需要更频繁的备份；对于一般的数据，允许数据丢失的时间比较长，可以使用较低的备份频率；对于一些不重要的数据，其

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

务器所在的硬件出现故障时，系统会自动将弹性云服务器迁移至正常的物理机，保障业务受到的影响最小，该过程会导致云服务器重启。详见“物理机故障时，弹性云服务器是否会自动恢复”。当检测到弹性云服务所在的硬件出现亚健康时，系统会自动化将弹性云服务器热迁移到其他物理服务器上继续运行，迁移过

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
RES13-01 采用自动弹性扩缩容 - 云架构中心

弹性扩缩容需要通过业务处理逻辑与数据分离、状态外置等技术手段支撑系统处理能力的快速增加或减少。系统扩容和缩容的处理方式有两种，一种是改变单机的处理能力，包括CPU、内存、存储等，称之为纵向伸缩；另一种是单机节点处理能力不变，通过增加节点的数量来改变系统的处理能力，称之为横向伸缩。系统设计时一般建议采用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
多活高可用(MAS) - 云架构中心
多活高可用(MAS) - 云架构中心

多活高可用(MAS)的混沌工程（ChaosEngineering）是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库，通过混沌实验编排攻击目标、攻击策略进行故障注入，支持添加背景流量和资源监控，同时在故障注入能力的基础上，通过体系化的流程和

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES13-04 支持主动扩容 - 云架构中心

华为云服务实例支持主动横向或纵向扩容功能；如对于ECS实例可以通过创建多个ECS实例实现横向扩容，也可升级ECS规格实现纵向扩容；对于RDS实例可升级RDS实例规格实现纵向扩容。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
PERF02-02 容量规划 - 云架构中心

源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，例如需要存储大量的数据，可能需要选择分布式存储系统。网络带宽：根据预测的需求，计算所需的网络带宽，例如需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具风险等级高关键策略流程和工具是经验的承载，通过标准化的流程，可以大幅降低在运维过程中因为个人的因素受到的影响和无序化。通过标准化的、统一的运维工具，向运维人员提供集中、统一维护界面及清晰易上手的操作手册，方便运维人员的集中维护，提高运维效率。常见的运维流程有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
人工智能性能优化 - 云架构中心

请内存的地方，均表现为一个tensor的申请释放）。 tensor的生命周期使用类似智能指针的引用计数方式来管理，且打通了Python与C++的通道，即：一个Python的tensor对象关联一个C++的tensor对象，Python的tensor对象的消失会触发C++的tens

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
云服务可靠性介绍 - 云架构中心

BMS裸金属服务 CCE云容器引擎 ELB弹性负载均衡 AS弹性伸缩 DCS分布式缓存服务 DMS分布式消息服务 RDS云数据库云数据库 TaurusDB云数据库 OBS对象存储服务父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
PERF02-01 定义性能目标 - 云架构中心

够适应不同的需求，同时保持最佳性能。尽早设计性能目标性能目标是定义性能的指标，清晰明确的性能目标是关键，通过性能目标，团队可以针对特定目标持续改进。为了确保系统能够满足预期的可靠性和性能要求，避免系统性能瓶颈，性能目标设计需要在部署业务之前开展，重点的是明确系统的需求和预期目标，以生成性能目标范围。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

当应用系统部署在云中，虽然云具有一定的高可用和故障自动恢复能力，但对外仍会导致短时间的故障，需要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因主备切换时，会导致连接中断，需要客户端重试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
云日志服务(LTS) - 云架构中心
云日志服务(LTS) - 云架构中心

云日志服务(LTS) 云日志服务（Log Tank Service，简称LTS）是高性能、低成本、功能丰富、高可靠的日志平台，提供全栈日志采集、百亿日志秒搜、PB级存储、日志加工、可视化图表、告警和转储等功能，满足应用运维、等保合规和运营分析等应用场景需求。云日志服务提供多种接

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES12-05 应急恢复回溯 - 云架构中心

RES12-05 应急恢复回溯在业务进行应急恢复处理后，需要对事件进行回溯并进行优化，以避免故障的再次发生。风险等级高关键策略对问题进行定位和修复，优化产品能力，减少同类事件的发生。针对应急恢复过程进行总结，优化恢复过程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
OPS07-04 支持故障恢复流程 - 云架构中心

控制流程，包含故障预防、故障发现、故障定位、故障恢复、故障复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长（MTTR）的长效收敛，实现故障的快速恢复。设计建议父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
PERF05-03 WEB场景资源优化 - 云架构中心

代码优化: 对云服务资源使用的代码进行优化，提高代码执行效率。数据库优化: 对云服务资源使用的数据库进行优化，如索引优化、查询优化等。负载均衡: 使用负载均衡技术，将请求分发到多个云服务资源，提高系统的处理能力。监控和调整: 持续监控云服务资源的性能，根据实际情况进行调整，以保持最佳性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
RES12-03 定期应急恢复演练 - 云架构中心

定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理

总条数： 276

上一页
1
...
8
9
10
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES06-03 支持亚健康检测 - 云架构中心

RES04 跨Region/跨云容灾 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

问题和检查项 - 云架构中心

RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

可靠性功能 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

多活高可用(MAS) - 云架构中心

RES13-04 支持主动扩容 - 云架构中心

PERF02-02 容量规划 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

人工智能性能优化 - 云架构中心

云服务可靠性介绍 - 云架构中心

PERF02-01 定义性能目标 - 云架构中心

RES09 故障重试 - 云架构中心

云日志服务(LTS) - 云架构中心

RES12-05 应急恢复回溯 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线