搜索_华为云

OPS06-01 建立可观测性体系 - 云架构中心

可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程就越快速越准确，而无需进行额外的测试或编码。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
COST04-02 主动监控成本 - 云架构中心

创建成本监控，华为云成本中心的成本监控引入机器学习，对客户历史消费数据进行建模，对于不符合历史数据模型的成本增长，识别为异常成本记录，同时提供异常增长的Top潜在原因。客户可设置监控提醒，定期获取影响成本高的异常记录提醒，进而快速做出反应，维持预期的成本支出。在费用中心设置可用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
COST08-02 云原生架构改造 - 云架构中心

COST08-02 云原生架构改造风险等级中关键策略基于云原生架构改造，主要是应用容器化和微服务化的改造，从而发挥云原生的优势，如：自动弹性扩缩容等，容器技术可以提高资源利用率，避免闲置资源，从而降低计算成本，应用微服务化可以降低运维复杂度，从而降低运维成本。广告电商等

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
OPS05-03 定义变更流程 - 云架构中心

确保执行变更的是与变更内容相关的技术人员，从而确保变更的准确执行。变更验证：在变更完成后，对变更对象与变更内容进行检查，确保变更并未影响实际业务，检查完成后，发布变更结果。变更关闭：在变更完成后，关闭变更任务。对变更记录进行留存，便于后续变更数据的运营与分析。设计建议父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES06-03 支持亚健康检测 - 云架构中心

控实例内的内存占用率，在超过阈值的情况下及时告警，人工介入迅速恢复，可避免造成业务中断。典型的亚健康场景有：通信链路丢包/错包、硬盘性能下降、CPU/内存过载等，当应用系统内组件出现亚健康时，可能会导致应用系统对外业务成功率下降。由于亚健康并非故障，因此针对亚健康的检测一般是

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

故障场景的覆盖率：分析故障场景的覆盖率，例如容灾场景覆盖 80%，过载场景覆盖 60%。故障场景的命中率：分析故障场景中，真实发生的比率。应急预案的质量：用于度量应急预案有效性和执行效率。风险发现个数与等级：定期评估分析（季度或年度）主动发现的风险数量和级别。风险消减个数、等级与类型：风险降

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-05 应急恢复回溯 - 云架构中心

RES12-05 应急恢复回溯在业务进行应急恢复处理后，需要对事件进行回溯并进行优化，以避免故障的再次发生。风险等级高关键策略对问题进行定位和修复，优化产品能力，减少同类事件的发生。针对应急恢复过程进行总结，优化恢复过程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

ELB采用集群化部署，支持多可用区的同城多活容灾，无缝实时切换。后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提高了业务的可靠性。当异常的后端服务器恢复正

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
RES10-02 应用系统多位置部署 - 云架构中心

应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES11-02 压力负载测试 - 云架构中心

HLS/RTMP/ WEBSOCKET/HTTP-FLV等协议构建的云应用提供性能测试的服务，其支持快速模拟大规模并发用户的业务高峰场景，通过自定义报文内容、时序、多事务组合等复杂场景，帮助用户测试验证业务高峰下的服务表现。父主题： RES11 可靠性测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
PERF05-02 通用算法优化 - 云架构中心

算法优化是提高程序性能的关键，可以通过改进算法的设计和实现方式来提高其效率和性能。以下是一些最佳实践：使用正确的数据结构：选择合适的数据结构可以大辐提高算法的效率。例如，使用哈希表可以快速查找元素，使用数组可以快速访问元素。减少内存分配：内存分配是一个耗时的操作。可以通过预先分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 算法优化
PERF06-03 自动告警 - 云架构中心

PERF06-03 自动告警风险等级中关键策略通过在云监控平台配置对应的告警策略，可以及时了解资源风险，以便做出对应调整和策略。相关云服务和工具：优化顾问 OA 云监控服务 CES 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
OPS05-02 进行变更风控 - 云架构中心

）时引发的业务中断风险及变更失败可能导致的业务受损风险。设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月变更导致对客户造成影响的事件数与总变更数的比值。计算公式：变更导致事件密度=变更导致对客户造成影响的事件数/总变更数。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS07-02 创建监控看板 - 云架构中心

创建监控看板风险等级高关键策略监控看板为您提供自定义查看监控数据的功能，将您关注的核心服务监控指标集中呈现在一张监控看板里，为您定制一个立体化的监控平台。同时监控看板还支持在一个监控项内对不同服务、不同维度的数据进行对比查看，实现不同云服务间性能数据对比查看。华为云相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
OPS07-03 支持事件管理 - 云架构中心

事件(incidents)是需要干预的事情。当发生事故(incidents)时，通过流程来处理。如何与团队沟通活动的状态？谁负责响应处置？使用哪些工具来缓解该事件？这些都是流程中需要回答的问题，并需要获得可靠的响应过程。流程必须中心化，并且可供参与工作负载的任何人使用。如果没有wiki

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES01-01 应用组件高可用部署 - 云架构中心

或中断。对已部署的应用系统，改造为支持高可用能力的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其高可用能力，即在其故障的情况下，是否能自动故障转移，进行业务恢复。针对未支持高可用的关键组件，进行如下优化处理：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES03-02 跨AZ数据同步 - 云架构中心

针对有状态业务，需要进行跨AZ的数据同步，以便在一个AZ故障的情况下，数据不丢失；对于无状态业务不涉及。风险等级高关键策略当应用组件对应的云服务实例支持跨AZ高可用实例时，可采用云服务实例自身的跨AZ数据同步；如RDS数据库、DCS实例、OBS桶等。当应用组件对应的云服务实例不支持跨

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

通过红蓝攻防，可以模拟各种复杂的攻击场景，帮助全面评估应用韧性，及时发现并解决潜在风险。风险等级高关键策略蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置。演练结束后，建议针对故障中的发现、响应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试

总条数： 381

上一页
1
...
15
16
17
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS06-01 建立可观测性体系 - 云架构中心

可靠性功能 - 云架构中心

COST04-02 主动监控成本 - 云架构中心

COST08-02 云原生架构改造 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

RES11-01 混沌测试 - 云架构中心

RES12-05 应急恢复回溯 - 云架构中心

可靠性功能 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

PERF05-02 通用算法优化 - 云架构中心

PERF06-03 自动告警 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

OPS07-02 创建监控看板 - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES03-02 跨AZ数据同步 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线