搜索_华为云

RES06-03 支持亚健康检测 - 云架构中心

关键策略亚健康检测通常用于根据亚健康症状来预测系统故障，典型的例子是内存泄漏，内存泄漏往往不会立刻导致系统失效，系统首先会因为Swap Memory不足变得运行缓慢，消耗内存量持续增加，因此通过监控实例内的内存占用率，在超过阈值的情况下及时告警，人工介入迅速恢复，可避免造成业务中断。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
COST03-03 公共成本分配 - 云架构中心

跨团队共享使用的CDN、直播带宽应按照各业务团队的实际带宽占比，将带宽费用拆分到不同的业务团队。跨团队共享使用的CCE集群服务，应按照各团队分配和使用的CPU/内存等比例，将容器集群成本（包含CCE、ECS、EVS等服务成本）拆分到各个业务团队。以上公共成本，以及其他共享资源&平台服务&服务支持&未

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

求接近0，需要实时备份；而对另外一些数据，重要性不高，可以容忍数据丢失，可以不做备份；此外还存在一些比较重要的数据，数据丢失的容忍程度各有不同，需要设计不同的备份策略。针对需要备份的数据设计备份方案以满足其RPO/RTO指标要求。父主题： RES02 备份

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES07-01 定义关键指标与阈值并监控 - 云架构中心

相比CPU利用率、内存利用率等基础指标，能更真实的指示系统性能问题。常用USE方法（Utilization Saturation and Errors Method）对资源监控，包含：使用率Utilization：覆盖系统资源，包括但不限于CPU、内存、网络、磁盘等。饱和

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink作为流数据处理引擎，依赖内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：根据自己的业务目标，规划CPU资源和内存资源。规划时，需要结合当前的数据分布情况，业务复杂度，设置JobManager的内存，TaskManag

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
Serverless性能优化 - 云架构中心

Go等编译型语言。内存规格函数Pod中分配的CPU资源与内存规格成正比，所以更大的内存规格可以获得更高的CPU资源从而提升执行性能。如果业务场景为CPU密集型或者需要大量使用内存的，建议配置更大的内存规格来获取更低的执行时延，可以通过配置不同大小内存进行性能测试，观察时延监控结合业务实际预算选择合适的内存规格。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

容灾来代替备份。备份恢复时的RPO指标（即数据丢失量），与最近一个备份时间点相关；不同类型的数据，允许丢失数据量可以不同，即RPO不同；为了保证数据备份的RPO目标，需要采用定期自动备份，而不要依赖人工进行手工备份。 RES02-01 识别和备份应用中所有需要备份的关键数据 RES02-02

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES02-02 自动数据备份 - 云架构中心

RES02-02 自动数据备份对于需要备份的数据，可根据该数据的RPO指标要求，设置定期备份策略进行自动备份。风险等级高关键策略使用华为云备份服务或第三方备份软件对数据进行备份，并可根据RPO要求设置自动备份频率。CBR云备份服务可对ECS/BMS/EVS/SFS Tu

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
PERF05-04 大数据场景资源优化 - 云架构中心

并行计算：使用并行计算框架，如Apache Spark、Apache Flink等，将计算任务分配到多个节点上并行执行，以提高计算速度和效率。内存优化：通过调整内存分配和使用策略，如使用内存缓存、内存映射等技术，以提高数据处理和计算的速度和效率。负载均衡：通过负载均衡技术，将数据和计算任务均匀地分配到多个节点

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
RES02-03 定期进行备份数据恢复 - 云架构中心

RES02-03 定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

续提供服务。数据备份和恢复云数据库 TaurusDB实例支持自动备份和手动备份，您可以定期对数据库进行备份，当数据库故障或数据损坏时，可以通过备份文件恢复数据库，从而保证数据可靠性。云数据库 TaurusDB支持同区域备份与跨区域备份；跨区域备份是将备份文件存放到另一个区域

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
数据库性能优化 - 云架构中心
数据库性能优化 - 云架构中心

的业务，需要将长事务KILL，后续业务侧尽量避免持锁长事务。 10.云数据库 TaurusDB长事务产生大量临时表导致内存超限的解决实践考虑升级实例规格，将内存利用率维持在合理范围，防止业务突增导致实例OOM，或根据业务实际情况优化慢查询。 11.云数据库 TaurusDB联合索引设置不当导致慢SQL的解决实践

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
变更防差错 - 云架构中心
变更防差错 - 云架构中心

变更防差错在系统的运行过程中，配置变更是导致生产系统不可用的重要风险之一，如配置修改、工作负载手工增缩或补丁安装等。当变更失败时，可能会导致性能下降或业务中断等严重的问题。因此为了降低变更带来的业务风险，需要为工作负载或其环境的更改做好准备，实现工作负载的可靠操作。变更操作属

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS05-02 进行变更风控 - 云架构中心

设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月变更导致对客户造成影响的事件数与总变更数的比值。计算公式：变更导致事件密度=变更导致对客户造成影响的事件数/总变更数。变更引入重大事件数定义：每月变更引入对客户产生重大影响的事件次数。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS06-02 定义可观测对象 - 云架构中心

的形式展示指标源、日志源以及系统图表信息。主要关注：WAITING 状态线程数、TIMED_WAITING 状态线程数、可使用内存等指标进程监控进程监控是针对主机内活跃进程进行的监控，默认采集活跃进程消耗的 CPU、内存，以及打开的文件数量等信息。当您配置了自定义进程监控，还

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

Redis单实例内多DB隔离性较差，Redis开源社区已经不再发展多DB特性，后续不建议依赖该特性。设置合理的内存淘汰（逐出）策略合理设置淘汰策略，可以在Redis内存意外写满的时候，仍然正常提供服务。强制 DCS默认的逐出策略为volatile-lru，请根据业务需求选择。Redis支持的数据逐出策略

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
ECS弹性云服务器 - 云架构中心
ECS弹性云服务器 - 云架构中心

ECS弹性云服务器弹性云服务器（Elastic Cloud Server，ECS）是由CPU、内存、操作系统、云硬盘组成的基础的计算组件。弹性云服务器创建成功后，就可以像使用自己的本地PC或物理服务器一样，在云上使用弹性云服务器。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
PERF04-03 性能测试步骤 - 云架构中心

系统组网、硬件规格等要保持与生产环境基本一致。性能测试环境配置通常要考虑以下因素：系统组网与架构：系统组网方式如主备、集群、分布式等组网，系统架构分析服务间依赖关系，确定周边依赖服务。硬件规格：所需服务器的数量、规格以及硬件配置，包括 CPU 主频/核数、内存容量、磁盘类型与容量、存储池类型与容量，网卡带宽等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试

总条数： 130

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES06-03 支持亚健康检测 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

COST03-03 公共成本分配 - 云架构中心

RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

Flink性能优化 - 云架构中心

Serverless性能优化 - 云架构中心

RES02 备份 - 云架构中心

RES02-02 自动数据备份 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

可靠性功能 - 云架构中心

数据库性能优化 - 云架构中心

变更防差错 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

缓存性能优化 - 云架构中心

ECS弹性云服务器 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线