搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

broker_disk_usage 磁盘容量使用率该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。 broker_cpu_core_load CPU核均负载该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。 broker_memory_usage 内存使用率该指标为Kafka节点虚拟机层面采集的内存使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
OPS07-01 创建可操作的告警 - 云架构中心

OPS07-01 创建可操作的告警风险等级高关键策略收到告警时，一般需要做出响应，消除无须响应的告警。比如磁盘IO 量瞬间飙升，CPU 使用率瞬间飙高，这类告警无需做出响应，对业务而言，意义就不大了。遵循可操作性原则能避免很多误报。并且要定期统计和分析告警频率，识别高频告警，解决告警问题，清除明确的告警误报。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
COST06-03 跟踪并监控权益商品的使用情况 - 云架构中心

在资源包到期后续购合适大小的资源包，避免浪费。相关服务和工具华为云成本中心提供资源包的使用率/覆盖率分析，您可以通过该工具了解已购资源包的使用率和覆盖率情况，识别资源包购买过多（使用率低），还是过少（覆盖率低），从而优化下一阶段的购买。华为云费用中心提供资源包剩余使用量预警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST06 使用不同计费模式优化成本
SEC05-06 使用托管云服务 - 云架构中心

为云的数据库服务而不是自建关系型数据库的实例。使用Serverless架构的云服务，将计算资源的安全交给华为云处理，减免了用户自行运维服务器带来的工作量和人为错误，减少了安全漏洞的风险。这样，用户能够将更多精力集中在业务逻辑和应用的安全性上。相关云服务和工具云数据库 RDS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
数据库性能优化 - 云架构中心
数据库性能优化 - 云架构中心

观测性能指标（GaussDB为例）指标ID 指标名称指标说明 rds001_cpu_util CPU使用率该指标用于统计测量对象的CPU使用率。 rds002_mem_util 内存使用率该指标用于统计测量对象的内存使用率。 rds003_bytes_in 数据写入量该指标用于统计测量对象对应VM的网络发送字节数，取时间段的平均值。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
人工智能性能优化 - 云架构中心

指标ID 指标名称指标说明 cpu_usage CPU使用率该指标用于统计ModelArts用户服务的CPU使用率。 mem_usage 内存使用率该指标用于统计ModelArts用户服务的内存使用率。 gpu_util GPU使用率该指标用于统计ModelArts用户服务的GPU使用情况。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
PERF03-05 选择合适类型的存储云服务 - 云架构中心

云硬盘概念提供按需扩展的高性能文件存储，可为云上多个云服务器提供共享访问。弹性文件服务就类似Windows或Linux中的远程目录。提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。可以为云服务器提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的存储云服务
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

、大规模文件存储、编译构建等场景）可能会比较消耗存储的带宽。根据业务的特征选择合适的虚拟机类型和规格。具体的虚拟机类型规格请参考官方文档。相关云服务和工具弹性云服务器 ECS 裸金属服务器 BMS 父主题：选择合适的计算资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

了达成该目标，一般需要最大限度利用集群的物理资源，如CPU、内存、磁盘IO，使其某一项达到瓶颈。调优原则提高CPU使用率同时减少额外性能开销。提高内存使用率。优化业务逻辑，减少计算量和IO操作。性能调优常用方法-DataStream调优配置内存：调整老年代和新生代的比

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

从HDFS中读入数据时，要考虑block解压缩后的数据膨胀。规划一定的磁盘作为缓存空间，包括缓存数据、日志、Shuffle数据。调优原则提高cpu使用率同时减少额外性能开销。提高内存使用率。优化业务逻辑，减少计算量和IO操作。典型业务的调优优化代码逻辑：在进行Spark参数调优之前，要进行相应的规划设计，优化代码逻辑。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

弹性伸缩的配置是否会被限制，比如AS弹性伸缩服务中可以配置能创建的最大实例数量，而在过载情况下是否能真的创建出那么多实例，会依赖于ECS弹性云服务器配额、EVS云硬盘配额，当需要弹性公网IP时涉及弹性公网IP配额等，当配额不足时会导致无法创建工作负载进行业务分担，而业务受损。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

个时间点大量Key过期。大量Key过期会导致CPU使用率冲高。命令使用规范原则原则说明级别备注谨慎使用O(N)复杂度的命令时间复杂度为O(N)的命令，需要特别注意N的值。避免N过大，造成Redis阻塞以及CPU使用率冲高。强制例如：hgetall、lrange、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
PERF04-06 建立性能可观测性体系 - 云架构中心

案。性能可观测体系在此基础上突出了性能指标，通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。性能监控对象：服务器、操作系统、数据库、应用程序、网络设备、云服务。常见性能指标：包括资源CPU、内存，硬盘等，及程序的响应时间、吞吐量、并发数等。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
SEC01-03 梳理资产清单 - 云架构中心

SEC01-03 梳理资产清单梳理工作负载涉及的服务器、IP地址、域名、数据库、证书等全量云资源的资产清单，给资源打上标签，从而在出现安全事件时，能快速定位到有安全风险的资源。风险等级高关键策略设计态与运行态一致性：对照设计态的架构图、架构文档实施云服务资源。工作负载运行时的架构始终保持与设计态一致。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
RES07-01 定义关键指标与阈值并监控 - 云架构中心

流量监控。 2、服务监控由于服务实例的冗余配置和应用系统的容错保护，业务指标正常并不意味着服务实例状态一定正常。例如，在配置了ELB的虚拟机集群中，ELB会主动隔离异常节点，虽然业务会在正常节点上分担，但应用系统实际已损失了部分处理容量。因此，云服务状态监控必不可少。云服务具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

当客户端请求超时或收到错误响应时，客户端需要决定是否重试；重试有助于客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。根据错误响应码进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

维知识，可以帮助运维人员快速解决问题，提高工作效率。一般通过运维知识库系统承载，运维人员可以轻松地查找和获取各种运维知识，包括网络配置、服务器管理、数据库维护等方面的知识。下面将介绍运维知识库系统的五个主要功能和优势。丰富的知识资源：运维知识库系统收集整理了大量的运维知识和经验

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

关组件的指标（如MapReduce/Spark/HDFS）。下面列举目前可查看到的相关指标信息：通用指标主要是指通用的服务器的相关性能指标：CPU使用率，内存占用量，磁盘IO读写速度，使用Core数量等，通过这些指标可以衡量任务在该类型机器或该机器上的执行情况，观察集群各机器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化

总条数： 263

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

Kafka性能优化 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

COST06-03 跟踪并监控权益商品的使用情况 - 云架构中心

SEC05-06 使用托管云服务 - 云架构中心

数据库性能优化 - 云架构中心

人工智能性能优化 - 云架构中心

PERF03-05 选择合适类型的存储云服务 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

Flink性能优化 - 云架构中心

Spark性能优化 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

可靠性功能 - 云架构中心

缓存性能优化 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

SEC01-03 梳理资产清单 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

OPS08-03 知识管理 - 云架构中心

HIVE优化 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线