搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
COST07-01 持续监控资源利用率指标 - 云架构中心

COST07-01 持续监控资源利用率指标风险等级高关键策略持续地在组织中定义资源的核心利用率指标（如CPU利用率，内存，CDN服务的流量，数据库的TPS），按（天、周、月）等时间周期发现规律，对低利用率资源的应用/项目进行审查。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
应用运维管理(AOM2.0) - 云架构中心

Operations Management，简称AOM）是云上应用的一站式立体化运维管理平台，融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源，提供应用资源统一管理、一站式可观测性分析和自动化运维方案，帮助用户及时发现故障，全面掌握应用、资源及业务的实时运行状况，提升企业海量运维的自动化能力和效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

功耗密集型业务（如高性能计算、人工智能、深度学习等场景）主要就是消耗计算维度的容量。内存密集型业务（如大数据处理、图像/视频处理、游戏开发、数据库等场景）主要消耗内存和存储维度的容量。存储密集型业务（如大型数据库、大数据分析、大规模文件存储、编译构建等场景）可能会比较消耗存储的带宽。根据业务的特征选

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
PERF06-02 性能劣化自动定界定位 - 云架构中心

需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层指标的聚合可视化能力，需要依赖持续的资源治理和数据治理。相关云服务和工具：优化顾问 OA 云监控服务 CES 应用运维管理 AOM 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式弹性伸缩失败检测：查看弹性伸缩组的弹性伸缩活动历史。恢复：根据伸缩活动失败描述信息进行修复。父主题： AS弹性伸缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

OPS06-07 通过可观测性指标引入自动化措施风险等级高关键策略可观测与自动化运维工具联动，实现自动化的故障检测、恢复及弹性伸缩等功能，进一步提升运维响应速度和准确性，降低人为干预带来的延误，甚至错误。父主题： OPS06 可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
设计原则 - 云架构中心
设计原则 - 云架构中心

设计原则建立持续改进的团队文化和标准化运维体系在卓越运营中，团队文化建设至关重要。运营是一门不断改进的艺术。只有不断从已有事故中学习经验，持续学习和改进，才能最终达到卓越运营。故而，团队应该培养持续学习和改进的文化，此外，在事故发生时，应该以对事不对人的态度，思考系统的改进，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
云监控中心(CES) - 云架构中心
云监控中心(CES) - 云架构中心

查故障时查看监控详情的需求。 OBS转储：云监控服务各监控指标的原始数据的保留周期为两天，超过保留周期后原始数据将不再保存。您可以在对象存储服务（Object Storage Service，以下简称OBS）创建存储桶，然后将原始数据同步保存至OBS，以保存更长时间。资源分组：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
性能效率支柱简介 - 云架构中心

资源占有量过大对常见的性能问题进行分析，可以发现对于一个系统或组件来说，性能问题经常发生在以下方面：实体间通信或者调用处理（包括数据库）频繁调用函数、模块处理过程、数据组织等问题并行处理资源争用引起的延迟串行处理进程/线程间等待延迟父主题：性能效率支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

支持上报服务端域名自定义，在用户面保持了业务一致性与合规性，降低了问题定位复杂度，提升了运维效率端侧日志数据毫秒级上报，数据0丢失：端侧采集日志后，毫秒级完成上报，且无数据丢失，支撑客户快速完成从前端到后端对问题做全链路追踪分析，同时，也支持对业务做完整性分析便捷低成本获取日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
RES13-04 支持主动扩容 - 云架构中心

当发现应用系统业务需要更多资源时，可主动扩展资源以满足需求，而避免影响可用性。典型场景如产品促销前预测会有突发大流量，则可手工进行扩容处理。华为云服务实例支持主动横向或纵向扩容功能；如对于ECS实例可以通过创建多个ECS实例实现横向扩容，也可升级ECS规格实现纵向扩容；对于RDS实例可升级RDS实例规格实现纵向扩容。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

将云服务器创建到其他AZ，以快速恢复业务。当选择多AZ部署时，可配置“多可用区扩展策略”为“均衡分布”或“选择优先”：均衡分布：云服务器扩容时优先保证选择的可用区列表中各可用区下云服务器数量均衡，当无法在目标可用区下完成云服务器扩容时，按照选择优先原则选择其他可用区。选择优

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

统计Kafka节点连接数。优化数据分区 Kafka将Topic划分为多个分区，所有消息分布式存储在各个分区上。每个分区有一个或多个副本，分布在不同的Broker节点上，每个副本存储一份全量数据，副本之间的消息数据保持同步。Kafka的Topic、分区、副本和代理的关系如下图所示：在实际业务过程中

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
PERF05-03 WEB场景资源优化 - 云架构中心

带宽、优化数据库查询等。云服务资源性能优化步骤包括: 识别性能瓶颈: 通过监控和分析云服务资源使用情况，找出性能瓶颈。优化资源配置: 根据性能瓶颈，调整云服务资源的配置，如 CPU 、内存、网络等。使用缓存: 使用缓存技术，如 CDN 、 Redis 等，提高数据访问速度。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
SEC09-03 实施安全审计 - 云架构中心

审计文件的完整性，防止文件被篡改。集中管控运维账号访问系统和资源的权限，对系统和资源的访问权限进行细粒度设置。关于数据的安全审计见：SEC07-03 对数据操作实施监控相关云服务和工具云审计服务 CTS：用户开通CTS后，系统会自动创建一个追踪器，该追踪器会自动识别并关联

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES06-03 支持亚健康检测 - 云架构中心

隔离或恢复处理，避免对业务造成影响。风险等级高关键策略亚健康检测通常用于根据亚健康症状来预测系统故障，典型的例子是内存泄漏，内存泄漏往往不会立刻导致系统失效，系统首先会因为Swap Memory不足变得运行缓慢，消耗内存量持续增加，因此通过监控实例内的内存占用率，在超过阈

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
SEC05-05 证书安全管理 - 云架构中心

避免使用过期证书，以防止安全漏洞和服务中断。安全存储：将证书存储在安全的位置，只允许授权人员访问。对私钥进行额外保护，如使用硬件安全模块（HSM）来存储私钥。加密传输：在证书的传输过程中使用加密通道，如SSL/TLS，以防止证书被篡改或窃取。避免在不安全的网络中传输证书，确保传输的安全性。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
OPS08-01 使用度量指标衡量运营目标 - 云架构中心

以及可能面临的挑战。并明确运营目标的关键绩效指标 (KPI)，可能是客户满意度、TTM、平均问题解决时间等等。根据 KPI，识别关键指标和数据源。客户满意度可能是各种指标的组合，例如呼叫等待或响应时间、满意度评分以及提出的问题类型。父主题： OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进

总条数： 330

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

COST07-01 持续监控资源利用率指标 - 云架构中心

应用运维管理(AOM2.0) - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

常见故障模式 - 云架构中心

OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

设计原则 - 云架构中心

云监控中心(CES) - 云架构中心

性能效率支柱简介 - 云架构中心

常见故障模式 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

RES13-04 支持主动扩容 - 云架构中心

可靠性功能 - 云架构中心

Kafka性能优化 - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

SEC05-05 证书安全管理 - 云架构中心

OPS08-01 使用度量指标衡量运营目标 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线