搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
SEC10-02 制定事件响应计划 - 云架构中心

SEC10-02 制定事件响应计划事件响应计划（Incident Response Plan, IRP）是组织安全策略的重要组成部分，它旨在确保在安全事件发生时，能够迅速、有序地采取行动，最大限度地减少损失，并尽快恢复正常运营。风险等级高关键策略建立事件响应计划，包括定

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

Kafka性能优化 Kafka性能优化优化客户端配置生产者配置建议可参考配置建议。消费者配置建议参数推荐值说明 max.poll.records 500 消费者一次能消费到的最大消息数量，默认为500，如果每条消息处理时间较长，建议调小该值，确保在max.poll.interval

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
SEC10-05建立复盘机制 - 云架构中心

SEC10-05 建立复盘机制建立安全事件复盘机制可以帮助团队从过去的安全事件中学习经验教训，并改进未来的安全措施。风险等级中关键策略确定复盘的目的：在进行复盘之前，明确目的是非常重要的。确定您希望从这次安全事件中学到什么，以及如何改进未来的安全措施。收集事实和数据：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
PERF04-01 定义验收标准 - 云架构中心

PERF04-01 定义验收标准风险等级高关键策略验收标准是用于评估指定工作负载是否满足性能要求的指标，需要在性能测试前期定义合理的验收标准。查看性能目标性能目标定义了工作负载所需的性能级别。查看为工作负载建立的性能目标。性能目标是可能涉及响应时间、吞吐量、资源利用率

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
PERF06-01 分层看护 - 云架构中心

PERF06-01 分层看护风险等级高关键策略基于业务的部署架构，一般可以从最底层的硬件基础设施到最上层的应用分成5层资源，云上服务可以只需要关注虚拟网络、实例、应用三层。结合每一层资源的特征指标进行分层建模，分别设置不同梯度的性能看护指标。通常按照指标劣化程度可以设计成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度某平台服务的认证驾驶员用户1000万人，货主用户500万人，集团业务覆盖全国339个主要城市，覆盖线路数量超过11万条，实现了全国多中心运营的架构。客户痛点：多云双活场景运维难保障：大规模集群场景，单个云厂商灾备不足以保障业

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
RES10-04 健康检查与自动隔离 - 云架构中心

RES10-04 健康检查与自动隔离对应用组件进行健康检查，当发现故障后进行主动隔离，避免故障扩散。风险等级高关键策略对系统内组件需要定期进行健康检查，以判断其状态是否正常。对于异常组件，需要能支持自动隔离，避免对整体业务造成影响。相关云服务和工具弹性负载均衡器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据备份和恢复使用CBR云备份服务可对ECS的备份保护服务，支持基于多云硬盘一致性快照技术的备份服务，并支持利用备份数据恢复ECS数据。详见“云备份概述”。故障自愈当ECS支持自动恢复时，可以开启自动恢复能力，当物理服务器损坏时以冷迁移方式重启ECS实例，使弹性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA DCS服务提供主备、Proxy集群、Cluster集群实例，通过节点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
SEC03-03 定期审视权限 - 云架构中心

SEC03-03 定期审视权限定期检视和更新权限，以避免权限蔓延，持续清理无用的权限。风险等级高关键策略使用IAM用户组控制人员的访问权限，并设置权限的到期时间。如果用户组的职责产生变化，应该及时调整用户组的权限。当账号委托给另一个账号时，设置到期时间。通过IAM

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
SEC09-01 实施标准化管理日志 - 云架构中心

SEC09-01 实施标准化管理日志对身份防线、网络防线、应用防线、主机防线、数据防线和运维防线等日志实施标准化管理，以监测系统和用户活动，实现日志的统一管理，并确保透明可追溯。风险等级高关键策略跟踪并监测对网络资源和关键数据的所有访问。通过系统的活动记录机制和用户活动

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES07-03 监控到异常后发送消息通知 - 云架构中心

RES07-03 监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份，避免单点风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

RabbitMQ性能优化保持尽可能短的队列长度太多的消息堆积在队列中会造成内存负载过高，为了释放内存，RabbitMQ 会把消息转存到磁盘，转存过程会耗费大量时间，造成消息处理速度下降或直接阻塞生产流程。因此队列中堆积过多的消息容易对 broker 产生负面效应。除此之外，如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
PERF05-03 WEB场景资源优化 - 云架构中心

PERF05-03 WEB场景资源优化风险等级中关键策略对于已经配置好的资源，可以通过优化来提高性能。例如，优化操作系统的设置、调整网络带宽、优化数据库查询等。云服务资源性能优化步骤包括: 识别性能瓶颈: 通过监控和分析云服务资源使用情况，找出性能瓶颈。优化资源配置:

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
COST05-02 建立可以量化的优化目标 - 云架构中心

COST05-02 建立可以量化的优化目标风险等级高关键策略成本优化是一项投资，而且是一个需要持续进行的流程。为了向公司或者组织的决策者、利益相关方说明投资的价值，就需要对成本优化自身，尤其是其执行的目标进行量化。从而在持续的优化活动中，都可以从决策者或者利益相关者那里得

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
COST07-01 持续监控资源利用率指标 - 云架构中心

COST07-01 持续监控资源利用率指标风险等级高关键策略持续地在组织中定义资源的核心利用率指标（如CPU利用率，内存，CDN服务的流量，数据库的TPS），按（天、周、月）等时间周期发现规律，对低利用率资源的应用/项目进行审查。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
OPS04-02 采用持续部署模型 - 云架构中心

OPS04-02 采用持续部署模型当部署出问题时，通过使用持续部署模型来实现尽早发现问题，减少对最终用户的影响。金丝雀部署是持续部署的常见模型，通过一小群内部或外部用户首先部署新功能，当新版本没有问题后，陆续部署到更大的组，直到所有用户群体都运行新版本。另一种常见的部署模型

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS07-01 创建可操作的告警 - 云架构中心

OPS07-01 创建可操作的告警风险等级高关键策略收到告警时，一般需要做出响应，消除无须响应的告警。比如磁盘IO 量瞬间飙升，CPU 使用率瞬间飙高，这类告警无需做出响应，对业务而言，意义就不大了。遵循可操作性原则能避免很多误报。并且要定期统计和分析告警频率，识别高

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理

总条数： 381

上一页
1
...
15
16
17
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

Kafka性能优化 - 云架构中心

SEC10-05建立复盘机制 - 云架构中心

PERF04-01 定义验收标准 - 云架构中心

PERF06-01 分层看护 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

SEC03-03 定期审视权限 - 云架构中心

SEC09-01 实施标准化管理日志 - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

RabbitMQ性能优化 - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

COST05-02 建立可以量化的优化目标 - 云架构中心

COST07-01 持续监控资源利用率指标 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线