搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
PERF04-06 建立性能可观测性体系 - 云架构中心

通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。性能监控对象：服务器、操作系统、数据库、应用程序、网络设备、云服务。常见性能指标：包括资源CPU、内存，硬盘等，及程序的响应时间、吞吐量、并发数等。父主题：建立性能可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
PERF03-03 使用弹性伸缩 - 云架构中心

峰期拥有足够的资源，并防止在低需求时段过度预配。虚拟机弹性伸缩和容器弹性伸缩都是实现应用自动化扩容和缩容的方式，但虚拟机弹性伸缩需要更多的资源和时间来启动和部署，而容器弹性伸缩可以更快速地响应变化，同时具有更高的资源利用率。虚拟机场景可以使用AS，容器场景充分考虑CA和HPA的弹性策略。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
人工智能性能优化 - 云架构中心

训练显存优化实践 pytorch的内存池基本管理策略 pytorch的内存池以block为粒度来进行管理，block池分为小内存池与大内存池，block是pytorch向device驱动申请内存的粒度，整存整取。用户/Pytorch代码向内存池申请内存的接口归一为tensor的申请释

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
COST03-03 公共成本分配 - 云架构中心

队的实际带宽占比，将带宽费用拆分到不同的业务团队。跨团队共享使用的CCE集群服务，应按照各团队分配和使用的CPU/内存等比例，将容器集群成本（包含CCE、ECS、EVS等服务成本）拆分到各个业务团队。以上公共成本，以及其他共享资源&平台服务&服务支持&未及时标记产生的未分配成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
RES07-01 定义关键指标与阈值并监控 - 云架构中心

相比CPU利用率、内存利用率等基础指标，能更真实的指示系统性能问题。常用USE方法（Utilization Saturation and Errors Method）对资源监控，包含：使用率Utilization：覆盖系统资源，包括但不限于CPU、内存、网络、磁盘等。饱和

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
Serverless性能优化 - 云架构中心

Go等编译型语言。内存规格函数Pod中分配的CPU资源与内存规格成正比，所以更大的内存规格可以获得更高的CPU资源从而提升执行性能。如果业务场景为CPU密集型或者需要大量使用内存的，建议配置更大的内存规格来获取更低的执行时延，可以通过配置不同大小内存进行性能测试，观察时延监控结合业务实际预算选择合适的内存规格。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

组件的指标（如MapReduce/Spark/HDFS）。下面列举目前可查看到的相关指标信息：通用指标主要是指通用的服务器的相关性能指标：CPU使用率，内存占用量，磁盘IO读写速度，使用Core数量等，通过这些指标可以衡量任务在该类型机器或该机器上的执行情况，观察集群各机器的通用指标，可以看到集群的负载是否均衡。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink作为流数据处理引擎，依赖内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：根据自己的业务目标，规划CPU资源和内存资源。规划时，需要结合当前的数据分布情况，业务复杂度，设置JobManager的内存，TaskManag

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

Redis单实例内多DB隔离性较差，Redis开源社区已经不再发展多DB特性，后续不建议依赖该特性。设置合理的内存淘汰（逐出）策略合理设置淘汰策略，可以在Redis内存意外写满的时候，仍然正常提供服务。强制 DCS默认的逐出策略为volatile-lru，请根据业务需求选择。Redis支持的数据逐出策略

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
OPS06-02 定义可观测对象 - 云架构中心

ER 主机监控主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为 ECS自动上报的监控指标，操作系统监控通过在ECS中安装Agent插件，为用户提供服务器的系统级、主动式、细颗粒度监控服务。主要关注：CPU_UTIL、DISK_READ_BYTES_RATE、带外网络流入速率等指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
设计原则 - 云架构中心
设计原则 - 云架构中心

检测范围：识别并跟踪检测所有组件，有重大影响的故障模式需要重点检测。亚健康检测：对不引起系统故障却导致系统或服务KPI下降的亚健康异常需要能检测，如网络时延变大、磁盘变慢、内存泄露等亚健康故障。备用检测：冗余系统中，主备用模块的故障都需要检测，避免静默故障。有特殊寿命器件：应及时监控有特殊寿命（如本地硬盘）要

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。 broker_cpu_core_load CPU核均负载该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。 broker_memory_usage 内存使用率该指标为Kafka节点虚拟机层面采集的内存使用率。 broker_cpu_usage

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
PERF04-03 性能测试步骤 - 云架构中心

系统组网、硬件规格等要保持与生产环境基本一致。性能测试环境配置通常要考虑以下因素：系统组网与架构：系统组网方式如主备、集群、分布式等组网，系统架构分析服务间依赖关系，确定周边依赖服务。硬件规格：所需服务器的数量、规格以及硬件配置，包括 CPU 主频/核数、内存容量、磁盘类型与容量、存储池类型与容量，网卡带宽等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
PERF02-02 容量规划 - 云架构中心

收集容量数据有助于将业务目标转化为技术要求，并且对于预测容量至关重要。为了满足工作负载需求，收集容量数据需要包括系统资源消耗数据以及业务关键数据。资源消耗数据：包括CPU、内存、磁盘空间、网络带宽等，以便确定系统的瓶颈所在。业务关键数据：包括用户数量、用户行为模式、业务类型、业务时段等，以便确定业务需求对工作负载的影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
PERF05-03 WEB场景资源优化 - 云架构中心

云服务资源性能优化步骤包括: 识别性能瓶颈: 通过监控和分析云服务资源使用情况，找出性能瓶颈。优化资源配置: 根据性能瓶颈，调整云服务资源的配置，如 CPU 、内存、网络等。使用缓存: 使用缓存技术，如 CDN 、 Redis 等，提高数据访问速度。代码优化: 对云服务资源使用的代码进行优化，提高代码执行效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
SEC01-03 梳理资产清单 - 云架构中心

SEC01-03 梳理资产清单梳理工作负载涉及的服务器、IP地址、域名、数据库、证书等全量云资源的资产清单，给资源打上标签，从而在出现安全事件时，能快速定位到有安全风险的资源。风险等级高关键策略设计态与运行态一致性：对照设计态的架构图、架构文档实施云服务资源。工作负载运行时的架构始终保持与设计态一致。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略

总条数： 126

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

人工智能性能优化 - 云架构中心

COST03-03 公共成本分配 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

常见故障模式 - 云架构中心

Serverless性能优化 - 云架构中心

HIVE优化 - 云架构中心

Flink性能优化 - 云架构中心

缓存性能优化 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

设计原则 - 云架构中心

Kafka性能优化 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

可靠性功能 - 云架构中心

PERF02-02 容量规划 - 云架构中心

常见故障模式 - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

SEC01-03 梳理资产清单 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线