搜索_华为云

RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

RES11-04 灾难演练通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

生成执行计划，并对执行计划进行优化，最后提交任务给YARN去执行。所以Hive的调优分为以下几个部分：接入层：主要包括用户的连接性能，如网络速度、认证、连接并发数。 HiveServer：以SQL的优化为主，执行计划是SQL优化的主要手段，通过接口查看Hive对整个SQL语句是

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当RDS实例由于过载导致网络限制时，可参考“RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高”的处理。父主题： RDS云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
参考案例 - 云架构中心
参考案例 - 云架构中心

参考案例通过AOM助力系统运维能力提升，降低运维成本与难度基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 LTS助力某公司高效完成日常业务运维与等保合规父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES06-03 支持亚健康检测 - 云架构中心

RES06-03 支持亚健康检测系统内组件有可能完全故障，也有可能处于亚健康状态；亚健康是指系统整体业务未超标，但系统中局部实例业务超标。亚健康更多是个相对概念，相对历史表现的统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法写入成功，可将数据写入本地缓存，待服务可用后再写入实例。当实例由于过载导致网络限制时，可参考“CPU /内存/带宽使用率过高”的处理。父主题： DMS分布式消息服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

(for MySQL)实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当GaussDB(for MySQL)实例由于过载导致网络限制时，可参考“RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高”的处理。父主题： GaussDB(for MySQL)云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
OPS06-06 实施分布式跟踪 - 云架构中心

编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时，标识符将被添加

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成功处理的控制过程；典型过载控制方法定义如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可用性需求 - 云架构中心
可用性需求 - 云架构中心

根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的可用性目标明

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
RES10-01 应用控制平面与数据平面隔离 - 云架构中心

而控制平面不直接处理业务，因此其故障时不应该影响业务系统。风险等级高关键策略应用控制平面与数据平面隔离，避免控制系统故障影响业务。数据平面所在业务系统的故障恢复可不依赖控制平面，避免由于控制平面故障而导致业务系统无法恢复。父主题： RES10 故障隔离

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

看任务的完成速度资源利用率：执行计算任务，查看在不同负载情况下，cpu、内存、网络的使用率。伸缩性： − 横向扩容带来的性能提升曲线：增加资源，执行相同计算任务，查看性能提升比率。 − 增加系统负担带来的性能下降曲线：在相同资源环境下，增加计算负载，查看性能下降比率父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
PERF04-02 选择合适的测试方式 - 云架构中心

性能验收：性能验收测试的运行环境必须是确定的，验证系统在确定的场景条件下是否达到了其宣称的能力规格。负载测试：是在被测系统上进行负载阶梯加载，直至摸到系统性能极限，一般用来测试系统性能容量或调优。压力测试：是检查系统处于超负载压力下的性能表现，可以考察系统的流控机制和极限场景下的性能。长时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
OPS06-01 建立可观测性体系 - 云架构中心

可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES12-02 制定应急预案 - 云架构中心

相关干系人都能够明确自身职责和所需要采取的措施。每个恢复操作动作必须明确无歧义，可指导操作人员。相关云服务和工具云运维中心 COC：支持应急预案管理。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
成本优化云服务介绍 - 云架构中心

企业中心面向大型企业，提供多账号环境下的财务管理服务，帮助企业以多层级组织的方式管理人、财、物，满足企业IT治理诉求。支持财务托管和财务独立两种多账号财务关联模式。理企业项目管理 EPS为客户提供单账号下的人财物权管理，用户可以根据组织架构规划企业项目，将企业分布在不同区域的资源按照企业项目进行统一管理，同时可以

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
COST03-01 制定成本分摊原则 - 云架构中心

本清晰可见。这也是上文中明确的团队责任的基础。根据清晰的成本，业务部门可准确定价，并平衡成本、稳定性和性能，经济高效的提供领先方案。企业管理者基于数据决策各业务的云开支，保障核心业务和战略业务方向的支出，不超支，不浪费。成本分配需匹配业务实质，具体有以下几个原则：按实际使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
RES04-03 容灾恢复过程自动化 - 云架构中心

容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES07-05 端到端跟踪请求消息 - 云架构中心

风险等级低关键策略消息跟踪需要包含消息处理流程中所有组件，以便跟踪结果完整，从而进行准确分析和定位。相关云服务和工具应用性能管理 APM：支持调用链追踪，能够针对应用的调用情况，对调用进行全方面的监控，可视化地还原业务的执行路线和状态，协助性能及故障快速定位。在查

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
COST06-02 为工作负载选择合适的计费模式 - 云架构中心

分析工作负载的每个组件。确定组件和资源是长时间运行（应享受承诺折扣，包年包月或购买资源包），还是短时间动态运行（采用 Spot 或按需定价）。使用成本管理工具中的建议对工作负载执行分析，并对这些建议应用业务规则以实现高回报。相关服务和工具为提高成本效率，华为云根据您过去的使用情况，为您提

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST06 使用不同计费模式优化成本

总条数： 290

上一页
1
...
8
9
10
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES11-04 灾难演练 - 云架构中心

HIVE优化 - 云架构中心

常见故障模式 - 云架构中心

参考案例 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

可用性需求 - 云架构中心

RES10-01 应用控制平面与数据平面隔离 - 云架构中心

Spark性能优化 - 云架构中心

PERF04-02 选择合适的测试方式 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

成本优化云服务介绍 - 云架构中心

COST03-01 制定成本分摊原则 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

RES07-05 端到端跟踪请求消息 - 云架构中心

COST06-02 为工作负载选择合适的计费模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线