搜索_华为云

RES07-01 定义关键指标与阈值并监控 - 云架构中心

常用USE方法（Utilization Saturation and Errors Method）对资源监控，包含：使用率Utilization：覆盖系统资源，包括但不限于CPU、内存、网络、磁盘等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
OPS06-02 定义可观测对象 - 云架构中心

基础监控为 ECS自动上报的监控指标，操作系统监控通过在ECS中安装Agent插件，为用户提供服务器的系统级、主动式、细颗粒度监控服务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类型业务提供容灾仲裁

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES02-02 自动数据备份 - 云架构中心

华为云云服务提供了备份工作负载数据的功能，典型的备份有：云备份CBR服务：CBR提供对磁盘（EVS）、服务器（ECS、HECS、BMS）基于快照的备份和恢复能力，SFS Turbo文件系统备份，云服务器部署的MySQL或SAP HANA等数据库备份，以及云上同步和管理线下备份软件

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据备份和恢复使用CBR云备份服务可对ECS的备份保护服务，支持基于多云硬盘一致性快照技术的备份服务，并支持利用备份数据恢复ECS数据。详见“云备份概述”。故障自愈当ECS支持自动恢复时，可以开启自动恢复能力，当物理服务器损坏时以冷迁移方式重启ECS实例，使弹性云服务器具备高可靠性和强大的动态迁移能力

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
RES05-01 网络连接高可用 - 云架构中心

RES05-01 网络连接高可用应用系统对外提供服务时，需要确保对外网络连接的高可用，避免单个网络连接中断而导致业务不可用。风险等级高关键策略网络链路冗余：网络连接需要支持多路径，以实现高可用能力，以避免在一条网络路径中断的情况下，业务能切换到其他路径继续通信。网络链路快速倒换

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
SEC09-03 实施安全审计 - 云架构中心

集中管控运维账号访问系统和资源的权限，对系统和资源的访问权限进行细粒度设置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
ECS弹性云服务器 - 云架构中心
ECS弹性云服务器 - 云架构中心

ECS弹性云服务器弹性云服务器（Elastic Cloud Server，ECS）是由CPU、内存、操作系统、云硬盘组成的基础的计算组件。弹性云服务器创建成功后，就可以像使用自己的本地PC或物理服务器一样，在云上使用弹性云服务器。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试当客户端请求超时或收到错误响应时，客户端需要决定是否重试；重试有助于客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析某公司核心业务专注于IT信息传播、技术交流、教育培训和专业技术人才服务。拥有超过3200万注册会员、超过1000家企业客户及合作伙伴。客户痛点：端侧采集工具不统一，不支持自定义域名上报，问题定位复杂 Web、IOS、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
参考案例 - 云架构中心
参考案例 - 云架构中心

参考案例通过AOM助力系统运维能力提升，降低运维成本与难度基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 LTS助力某公司高效完成日常业务运维与等保合规父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES07-05 端到端跟踪请求消息 - 云架构中心

RES07-05 端到端跟踪请求消息端到端跟踪请求消息的处理流程，便于分析和调试问题，并提高处理性能。风险等级低关键策略消息跟踪需要包含消息处理流程中所有组件，以便跟踪结果完整，从而进行准确分析和定位。相关云服务和工具应用性能管理 APM：支持调用链追踪，能够针对应用的调用情况

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES01-03 云服务器反亲和 - 云架构中心

RES01-03 云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ECS，需要配置主机组反亲和，从而可以将相同业务的ECS调度到不同物理服务器上

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
RES06-02 面向所有故障进行检测 - 云架构中心

比较测试：当系统具有冗余时，可以使两个系统并行进行计算，然后对结果进行比较，如果结果不匹配则认为发生了故障。这种概念也称为表决。比较可以在系统的任何层次上进行，包括在一条内存总线上的cycle by cycle的比较，到最终发送到网络上结果的比较。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
PERF04-03 性能测试步骤 - 云架构中心

输出系统各个场景所要达到的SLA。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
RES11-02 压力负载测试 - 云架构中心

RES11-02 压力负载测试通过施加超出系统容量的业务压力，验证云服务的过载保护、业务隔离和优雅降级等能力。为全面验证系统整体的容量规划和业务依赖，云服务应用通常采用全链路压测进行测试。风险等级高关键策略模拟大量接口消息进行压力测试。模拟各种业务场景进行压力测试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES14-02 自动化变更 - 云架构中心

RES14-02 自动化变更自动化变更是指自动化提供并管理应用程序的环境（计算、存储、网络、中间件服务等）、安装、配置，实现Infrastructure as a Code；以解决手工部署中易于出错、依赖个人能力，手工配置中变更无法跟踪、难以回滚等难题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错

总条数： 131

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES07-01 定义关键指标与阈值并监控 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES02-02 自动数据备份 - 云架构中心

可靠性功能 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

ECS弹性云服务器 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

常见故障模式 - 云架构中心

参考案例 - 云架构中心

RES07-05 端到端跟踪请求消息 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

RES14-02 自动化变更 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线