搜索_华为云

OPS04-01 有效落地持续集成 - 云架构中心

OPS04-01 有效落地持续集成风险等级高关键策略持续集成是一种软件开发实践，开发人员使用它定期将软件更新集成到源代码控制系统中。当工程师向代码仓提交代码时，持续集成过程就开始了。理想情况下，集成过程会根据多个基线和测试来验证代码。然后，它向提交者提供有关这些测试状态的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS04-03 基础设施即代码 - 云架构中心

OPS04-03 基础设施即代码基础设施即代码（IaC）是指使用代码而不是手动流程来管控基础设施的能力。应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES09-03 重试需要避免造成流量压力 - 云架构中心

RES09-03 重试需要避免造成流量压力对于链路闪断等原因导致的临时性故障，客户端进行一定的重试，可取得较好的效果；对于流量过载等原因导致的故障，重试可能会导致情况进一步恶化，因此需要避免这种影响。风险等级高关键策略客户端进行重试处理时，建议：增加指数回退和抖动方法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
SEC10-02 制定事件响应计划 - 云架构中心

SEC10-02 制定事件响应计划事件响应计划（Incident Response Plan, IRP）是组织安全策略的重要组成部分，它旨在确保在安全事件发生时，能够迅速、有序地采取行动，最大限度地减少损失，并尽快恢复正常运营。风险等级高关键策略建立事件响应计划，包括定

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

Kafka性能优化 Kafka性能优化优化客户端配置生产者配置建议可参考配置建议。消费者配置建议参数推荐值说明 max.poll.records 500 消费者一次能消费到的最大消息数量，默认为500，如果每条消息处理时间较长，建议调小该值，确保在max.poll.interval

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RES08-03 减少被依赖项故障的影响 - 云架构中心

RES08-03 减少被依赖项故障的影响被依赖项自身的可用性需要增强，以减少对依赖它的组件的影响。风险等级中关键策略对于被依赖项本身，为减少由于服务故障或运行缓慢对依赖它的组件的影响，需要考虑使用以下技术和原则：减少被依赖项本身的外部依赖。优化性能，减少消息响应时延和负载。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES12-04 出现问题后尽快恢复业务 - 云架构中心

RES12-04 出现问题后尽快恢复业务应用系统出现故障后，需要能尽快发现，尽快响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
OPS08-01 使用度量指标衡量运营目标 - 云架构中心

OPS08-01 使用度量指标衡量运营目标风险等级高关键策略定义清晰的运营成功的目标和 KPI，设置基线作为参考点并定期重新评估。与业务领导者和利益相关者确定服务的总体目标。确定各个运营团队的任务以及可能面临的挑战。并明确运营目标的关键绩效指标 (KPI)，可能是客户满意度、TTM、平均问题解决时间等等。根据

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
OPS03-01 推行开发者测试 - 云架构中心

OPS03-01 推行开发者测试风险等级高关键策略开发者测试是现代软件工程中非常重要的一环，一般而言，开发者的测试代码可以在本地，或者构建阶段反复多次执行，依赖低，也是在软件系统运维之前成本最低的发现软件问题的方式，尤其是各种异常场景或者用户输入，开发者测试的过程实际上“

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES07-05 端到端跟踪请求消息 - 云架构中心

RES07-05 端到端跟踪请求消息端到端跟踪请求消息的处理流程，便于分析和调试问题，并提高处理性能。风险等级低关键策略消息跟踪需要包含消息处理流程中所有组件，以便跟踪结果完整，从而进行准确分析和定位。相关云服务和工具应用性能管理 APM：支持调用链追踪，能够针对应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES07-03 监控到异常后发送消息通知 - 云架构中心

RES07-03 监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份，避免单点风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

RabbitMQ性能优化保持尽可能短的队列长度太多的消息堆积在队列中会造成内存负载过高，为了释放内存，RabbitMQ 会把消息转存到磁盘，转存过程会耗费大量时间，造成消息处理速度下降或直接阻塞生产流程。因此队列中堆积过多的消息容易对 broker 产生负面效应。除此之外，如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
SEC09-01 实施标准化管理日志 - 云架构中心

SEC09-01 实施标准化管理日志对身份防线、网络防线、应用防线、主机防线、数据防线和运维防线等日志实施标准化管理，以监测系统和用户活动，实现日志的统一管理，并确保透明可追溯。风险等级高关键策略跟踪并监测对网络资源和关键数据的所有访问。通过系统的活动记录机制和用户活动

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
PERF03-03 使用弹性伸缩 - 云架构中心

PERF03-03 使用弹性伸缩风险等级中关键策略如果工作负载能够支持弹性（例如：应用无状态化），请考虑具有自动缩放功能的计算服务，该功能可根据需求自动调整计算容量。自动缩放有助于确保在高峰期拥有足够的资源，并防止在低需求时段过度预配。虚拟机弹性伸缩和容器弹性伸缩都是实现

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
SEC09-02 安全事件记录及分析 - 云架构中心

SEC09-02 安全事件记录及分析在发生安全事件之前，可以考虑构建取证能力来支持安全事件调查工作。记录攻击和异常行为并对其分析：应在关键网络节点处（例如内外网的交界处、ELB流量转发处等）检测、防止或限制网络攻击行为；应采取技术措施对采集的安全日志进行持续监控和分析，实现对网

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀针对无状态集群业务，通过负载均衡来保证业务均匀分发，可避免部分组件空闲，而部分组件过载而影响业务；同时还可以充分利用系统资源，提高系统性能，改善系统可靠性。风险等级高关键策略负载均衡分发业务粒度需避免过大，而导致部分组件过载。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES14-04 提供runbook进行标准化变更 - 云架构中心

RES14-04 提供runbook进行标准化变更 runbook是指运行手册，是用来实现变更的详细操作过程。变更前需提供标准化runbook用于变更和回退，变更过程中严格按照runbook执行，在变更失败时根据runbook进行回退。风险等级高关键策略 runbook需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错

总条数： 381

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS04-01 有效落地持续集成 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

RES09-03 重试需要避免造成流量压力 - 云架构中心

常见故障模式 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

Kafka性能优化 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

OPS08-01 使用度量指标衡量运营目标 - 云架构中心

OPS03-01 推行开发者测试 - 云架构中心

RES07-05 端到端跟踪请求消息 - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

RabbitMQ性能优化 - 云架构中心

SEC09-01 实施标准化管理日志 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

SEC09-02 安全事件记录及分析 - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

RES14-04 提供runbook进行标准化变更 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线