搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES06-01 故障模式分析 - 云架构中心

的故障管理，应用系统可减少对机房、电力、环境、计算服务器、存储设备、网络交换机等基础设施的故障模式的检测和恢复处理，但仍需考虑这些基础设施故障对应用系统的影响及对应的恢复措施，如机房发生灾难(AZ或Region级灾难)、计算服务器故障/重启、使用本地硬盘时硬盘故障/亚健康、网络通

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
PERF04-06 建立性能可观测性体系 - 云架构中心

通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。性能监控对象：服务器、操作系统、数据库、应用程序、网络设备、云服务。常见性能指标：包括资源CPU、内存，硬盘等，及程序的响应时间、吞吐量、并发数等。父主题：建立性能可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何?”。数据备份和恢复 OBS支持多版本控制，可以在

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
COST03-03 公共成本分配 - 云架构中心

队的实际带宽占比，将带宽费用拆分到不同的业务团队。跨团队共享使用的CCE集群服务，应按照各团队分配和使用的CPU/内存等比例，将容器集群成本（包含CCE、ECS、EVS等服务成本）拆分到各个业务团队。以上公共成本，以及其他共享资源&平台服务&服务支持&未及时标记产生的未分配成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
PERF05-03 WEB场景资源优化 - 云架构中心

例如，优化操作系统的设置、调整网络带宽、优化数据库查询等。云服务资源性能优化步骤包括: 识别性能瓶颈: 通过监控和分析云服务资源使用情况，找出性能瓶颈。优化资源配置: 根据性能瓶颈，调整云服务资源的配置，如 CPU 、内存、网络等。使用缓存: 使用缓存技术，如 CDN 、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
人工智能性能优化 - 云架构中心

量block被切小了的可使用内存但是当申请一个大块内存时又无法复用，这种会导致reserved 与 allocated 的较大差值，通常称为内存碎片。 pytorch的内存碎片影响因素一个step里更多的内存申请释放内存次数理论上一定会导致更多的内存碎片，为什么说是一个step

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
数据库性能优化 - 云架构中心
数据库性能优化 - 云架构中心

MySQL)长事务产生大量临时表导致内存超限的解决实践考虑升级实例规格，将内存利用率维持在合理范围，防止业务突增导致实例OOM，或根据业务实际情况优化慢查询。 11.GaussDB(for MySQL)联合索引设置不当导致慢SQL的解决实践查询变慢首先确认是否由于CPU利用率达到性能瓶

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink作为流数据处理引擎，依赖内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：根据自己的业务目标，规划CPU资源和内存资源。规划时，需要结合当前的数据分布情况，业务复杂度，设置JobManager的内存，TaskManag

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
Serverless性能优化 - 云架构中心

Go等编译型语言。内存规格函数Pod中分配的CPU资源与内存规格成正比，所以更大的内存规格可以获得更高的CPU资源从而提升执行性能。如果业务场景为CPU密集型或者需要大量使用内存的，建议配置更大的内存规格来获取更低的执行时延，可以通过配置不同大小内存进行性能测试，观察时延监控结合业务实际预算选择合适的内存规格。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES07-01 定义关键指标与阈值并监控 - 云架构中心

SDK获取指定服务的监控指标。 AOM服务提供了微服务应用和节点的关键指标监控能力。云容器工作负载关键指标在CSE服务中查看。函数服务关键指标在FunctionGraph控制台中查看。 3、资源监控资源监控通常用于识别资源瓶颈分析系统性能问题。对应用系统资源进行监控时，需要先定义资源的关键

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

合理选择规格如果业务增长会带来Redis请求增长，请选择集群实例（Proxy集群和Cluster集群）强制单机和主备扩容只能实现内存、带宽的扩容，无法实现计算性能扩容。生产实例需要选择主备或者集群实例，不能选用单机实例强制 - 主备实例，不建议使用过大的规格。建议

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
PERF04-03 性能测试步骤 - 云架构中心

系统组网、硬件规格等要保持与生产环境基本一致。性能测试环境配置通常要考虑以下因素：系统组网与架构：系统组网方式如主备、集群、分布式等组网，系统架构分析服务间依赖关系，确定周边依赖服务。硬件规格：所需服务器的数量、规格以及硬件配置，包括 CPU 主频/核数、内存容量、磁盘类型与容量、存储池类型与容量，网卡带宽等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
PERF03-03 使用弹性伸缩 - 云架构中心

峰期拥有足够的资源，并防止在低需求时段过度预配。虚拟机弹性伸缩和容器弹性伸缩都是实现应用自动化扩容和缩容的方式，但虚拟机弹性伸缩需要更多的资源和时间来启动和部署，而容器弹性伸缩可以更快速地响应变化，同时具有更高的资源利用率。虚拟机场景可以使用AS，容器场景充分考虑CA和HPA的弹性策略。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
COST08-04 Serverless探索 - 云架构中心

网络等资源，提升整体资源利用率、缩短需求发布周期，提高应用的研发效率。用户可以通过云监控服务监控Serverless实例的CPU使用率、内存使用率，当满足一定条件，自动触发Serverless算力扩容和缩容，从而提供资源使用率，降低成本。相关服务和工具华为云以Serverl

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

资源自动扩容考虑了配额限制压力负载测试 RES14 您如何进行配置防差错？变更防呆检查自动化变更变更前数据备份提供runbook进行标准化变更 RES15 您如何进行升级不中断业务？自动化部署和升级自动化检查自动化回滚灰度部署和升级父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
OPS06-02 定义可观测对象 - 云架构中心

ER 主机监控主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为 ECS自动上报的监控指标，操作系统监控通过在ECS中安装Agent插件，为用户提供服务器的系统级、主动式、细颗粒度监控服务。主要关注：CPU_UTIL、DISK_READ_BYTES_RATE、带外网络流入速率等指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

S弹性伸缩服务中可以配置能创建的最大实例数量，而在过载情况下是否能真的创建出那么多实例，会依赖于ECS弹性云服务器配额、EVS云硬盘配额，当需要弹性公网IP时涉及弹性公网IP配额等，当配额不足时会导致无法创建工作负载进行业务分担，而业务受损。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

GaussDB(for MySQL)的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库

总条数： 197

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

可靠性功能 - 云架构中心

COST03-03 公共成本分配 - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

人工智能性能优化 - 云架构中心

数据库性能优化 - 云架构中心

Flink性能优化 - 云架构中心

Serverless性能优化 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

缓存性能优化 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

COST08-04 Serverless探索 - 云架构中心

问题和检查项 - 云架构中心

常见故障模式 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线