搜索_华为云

OPS01-02 规划标准化的运维组织 - 云架构中心

陷问题。此外也可以使用DevOps模式，由开发工程师直接运维系统，而保留一个小而精干的卓越运营使能团队，用于负责组织整体的卓越运营流程改进和相应的流程工具落地。无论如何设立组织，应该确保具有一个整体的流程，在流程中的每个团队和成员都有自己明确的责任。同时可以使用明确的方式（

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
RES07-01 定义关键指标与阈值并监控 - 云架构中心

态、资源状态三个层面进行监控。根据业务规模，可以使用CES服务（侧重在I层服务）或AOM/APM服务（侧重在P层业务），也可以借助Prometheus、Zabbix、Zipkin等部件自行搭建，使用Grafana等部件进行界面展示和时序对齐。 1、业务监控以下4个黄金指标，是针

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES07-05 端到端跟踪请求消息 - 云架构中心

在查询后的调用链列表中，单击待查看的调用链的链接，查看该调用链基本信息。调用链详情页面可以查看调用链的完整链路信息，包含本地方法堆栈和相关远程调用的调用关系。调用链与日志关联，提高用户体验。用户可以从调用链直接跳转LTS查看日志。父主题： RES07 监控告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
性能数据采集 - 云架构中心
性能数据采集 - 云架构中心

此数据包括数值，称为指标。指标描述系统在特定时间点的状态。它还包括包含组织成记录的不同类型的数据的日志。通过收集性能数据，可以监视和分析工作负载的性能。可以使用此信息来识别性能瓶颈、解决问题、优化资源分配，以及做出数据驱动的决策，以提高工作负载的整体性能效率。影响：如果没有数

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。通过过载保护，可以缓解客户流量突增、泛洪攻击或重试风暴所造成的大量容量峰值情况，让工作负载能够继续正常处理支持的请求量，避免出现资源耗尽而导致所有请求都不能处理的情况。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
RES12-02 制定应急预案 - 云架构中心

RES12-02 制定应急预案针对常见问题现象，提供标准化的应急恢复指导，以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES12-04 出现问题后尽快恢复业务 - 云架构中心

RES12-04 出现问题后尽快恢复业务应用系统出现故障后，需要能尽快发现，尽快响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES13-04 支持主动扩容 - 云架构中心

避免影响可用性。典型场景如产品促销前预测会有突发大流量，则可手工进行扩容处理。华为云服务实例支持主动横向或纵向扩容功能；如对于ECS实例可以通过创建多个ECS实例实现横向扩容，也可升级ECS规格实现纵向扩容；对于RDS实例可升级RDS实例规格实现纵向扩容。父主题： RES13

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
SEC06-03 实行代码白盒检视 - 云架构中心

潜在的问题和改进空间。风险等级中关键策略制定检视计划：确定检视的频率和时间安排，以确保代码检视是持续的活动。确定检视范围，例如可以是每次提交、每个功能完成后，或者定期的大规模检视。培训团队成员：提供培训以确保团队成员了解如何进行有效的代码检视。确保团队了解代码检

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

KPI 指标，提供团队级别的报告，实现成本透明度和成本问责制，这些指标可以包含收益/成本比率，单位商品成本，核心资源利用率等等。值得注意的是，成本优化不是一锤子买卖，团队对责任的接受，实施包括指标自身的完善都需要一个过程。 KPI指标应该随着阶段的演变而演变，以建立不断成功，不断进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
设计原则 - 云架构中心
设计原则 - 云架构中心

善整体性能；如多个进程可以从一个数据库的同一部分读取。并行处理：当并行处理过程的增速能抵消通信开销和资源争用延迟时，执行并行处理。分散负载原则：通过在不同时间或者不同位置处理冲突负载，从而分散负载：将资源划分为成一些相对独立的小资源组，不同进程/线程可以独立访问，是“资源”分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
OPS03-01 推行开发者测试 - 云架构中心

了其它模块而造成线上系统的问题，有了开发者测试之后，只要在改完代码后运行一下测试就知道改动对整个系统的影响了，从而可以让我们放心的重构和演进代码。同时，应该有一个适用于您软件的开发者测试标准，如代码覆盖率和分支覆盖率。父主题： OPS03 完备的测试验证体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES01-03 云服务器反亲和 - 云架构中心

针对多个承载相同业务的ESC，需要配置主机组反亲和，从而可以将相同业务的ECS调度到不同物理服务器上，以避免由于单台物理服务器故障而导致所有业务不可用的场景。若ECS通过AS进行弹性伸缩时，则需要AS配置云服务器组反亲和，以避免AS自动创建的ECS运行在同一个物理服务器上。若CCE集群节点或节点

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。根据错误响应码进行有针对性的重试；对于临时性故障，如错误码指示为系统繁忙时，可等待一段时间后重试，否则无需重试。请求SDK中内置了消息重试时，客户端无需重复重试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

RES11-05 红蓝攻防通过红蓝攻防，可以模拟各种复杂的攻击场景，帮助全面评估应用韧性，及时发现并解决潜在风险。风险等级高关键策略蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

应用系统负载均衡，避免流量不均匀针对无状态集群业务，通过负载均衡来保证业务均匀分发，可避免部分组件空闲，而部分组件过载而影响业务；同时还可以充分利用系统资源，提高系统性能，改善系统可靠性。风险等级高关键策略负载均衡分发业务粒度需避免过大，而导致部分组件过载。负载均衡分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
SEC07-02 数据保护控制 - 云架构中心

别的数据保护控制，保护数据的机密性和完整性。风险等级高关键策略实施适当的数据保护措施，如加密和身份验证。管理数据访问权限。了解谁可以访问、修改和删除数据，有助于限制数据访问权限，减少数据泄露风险。验证只有获得授权的用户按照“最小化权限”原则访问数据，确保只有经授权的用户才能执行相关操作。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 数据安全与隐私保护 > SEC07 通用数据安全
OPS03-03 进行性能压测 - 云架构中心

户数量的情况下，获取不同数量级别的硬件设备或云服务性能指标，以确定业务系统的最佳容量和最大容量。并发测试：测试多个用户同时访问同一个应用、同一个模块或者数据记录时是否存在死锁或者其他性能问题，所以几乎所有的性能测试都会涉及一些并发测试。因为并发测试对时间的要求比较苛刻，通常并发

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系

总条数： 199

上一页
1
...
6
7
8
9
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS01-02 规划标准化的运维组织 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES07-05 端到端跟踪请求消息 - 云架构中心

性能数据采集 - 云架构中心

RES13 过载保护 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

RES13-04 支持主动扩容 - 云架构中心

SEC06-03 实行代码白盒检视 - 云架构中心

COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

设计原则 - 云架构中心

OPS03-01 推行开发者测试 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

SEC07-02 数据保护控制 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线