搜索_华为云

基础概念 - 云架构中心
基础概念 - 云架构中心

确定性运维旨在构建可防、可控、可治的运维管理体系。首先是通过高质量的产品开发，严谨的运维流程和制度来降低故障的概率，要挑战零故障，同时也要有技术手段对可能发生的故障，将间隔、影响范围及故障恢复时间做到可防、可控、可治，要把数字化带来的“不确定性”通过运维变成“确定性”。 IaC 基础设施即代码

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
参考案例 - 云架构中心
参考案例 - 云架构中心

参考案例通过AOM助力系统运维能力提升，降低运维成本与难度基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 LTS助力某公司高效完成日常业务运维与等保合规父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

到华为云。接入层（外部GSLB、API网关）：通过外部GSLB进行域名解析与流量负载均衡，两朵云同时提供服务，在第三方云故障时自动将业务流量切换到华为云；API网关支持流量纠正，以便将业务路由到正确单元。应用层（负载均衡器、应用软件及容器）：对于无状态应用，通过负载均衡器进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
OPS06 可观测性体系 - 云架构中心

制定和实施可观测性指标 OPS06-04 规范化应用日志 OPS06-05 实施依赖项遥测 OPS06-06 实施分布式跟踪 OPS06-07 通过可观测性指标引入自动化措施父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES14 配置防差错 - 云架构中心
RES14 配置防差错 - 云架构中心

RES14 配置防差错配置防差错是针对配置过程中因人输入了错误的配置数据导致系统和业务受损或失效场景下通过产品设计降低或避免配置错误产生的影响。 RES14-01 变更防呆检查 RES14-02 自动化变更 RES14-03 变更前数据备份 RES14-04 提供runbook进行标准化变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错
卓越运营支柱 - 云架构中心
卓越运营支柱 - 云架构中心

卓越运营支柱卓越运营支柱简介基础概念设计原则问题和检查项 OPS01 建立持续改进的团队文化和标准化的运维体系 OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS03 完备的测试验证体系 OPS04 自动化构建和部署流程 OPS05 运维准备和变更管理 OPS06

帮助中心 > 云架构中心 > 卓越架构技术框架与实践
RES10 故障隔离 - 云架构中心
RES10 故障隔离 - 云架构中心

散，从而造成整个系统失效。故障隔离技术的核心思想是将一个工作负载内的故障影响限制于有限数量的组件内，降低故障影响范围，防止产生级联故障。通过划分故障隔离域，限制工作负载的影响，可有效进行故障隔离。 RES10-01 应用控制平面与数据平面隔离 RES10-02 应用系统多位置部署

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
选择合适网络服务资源 - 云架构中心

评估合适网络云服务，主要考虑如下性能指标：网络流量：评估工作负载的预期网络流量，了解数据传输需求和网络请求的频率。带宽要求：确定工作负载的带宽要求，考虑通过网络传输和接收的数据量。网络延迟：评估工作负载所需的延迟，使用专用虚拟网络和主干网络，而不是遍历公共Internet。此方法可降低工作负载的延迟。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
性能测试 - 云架构中心
性能测试 - 云架构中心

性能测试性能测试是一种软件测试形式，通过性能测试工具模拟正常、峰值及异常负载等状态下对系统的各项性能指标进行测试的活动，它关注运行系统在特定负载下的性能，可帮助你评估系统负载在各种方案中的功能，涉及系统在负载下的响应时间、吞吐量、资源利用率和稳定性，以帮助确保系统性能满足基线要

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析
RES14-03 变更前数据备份 - 云架构中心

RES14-03 变更前数据备份通过配置数据事前备份与恢复设计，确保在出现配置错误时能够快速恢复到正确的配置数据状态。风险等级高关键策略进行全量数据备份，以防变更过程中数据被破坏，影响业务。异常回滚时，可使用备份数据进行恢复。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。通过过载保护，可以缓解客户流量突增、泛洪攻击或重试风暴所造成的大量容量峰值情况，让工作负载能够继续正常处理支持的请求量，避免出现资源耗尽而导致所有请求都不能处理的情况。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
SEC01 云安全治理策略 - 云架构中心

云安全治理策略包括安全团队、安全基线、安全资产、安全建模以及核心的安全控制点。企业需尽早规划和思考如何使用云技术和云服务来实现安全治理的现代化，并通过实施合理的云安全策略，实现云上业务系统的安全、合规。 SEC01-01 建立安全管理团队 SEC01-02 建立安全基线 SEC01-03

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略
性能数据采集 - 云架构中心
性能数据采集 - 云架构中心

供有关工作负载性能的信息。此数据包括数值，称为指标。指标描述系统在特定时间点的状态。它还包括包含组织成记录的不同类型的数据的日志。通过收集性能数据，可以监视和分析工作负载的性能。可以使用此信息来识别性能瓶颈、解决问题、优化资源分配，以及做出数据驱动的决策，以提高工作负载的整体性能效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析
OPS07-03 支持事件管理 - 云架构中心

ts)时，通过流程来处理。如何与团队沟通活动的状态？谁负责响应处置？使用哪些工具来缓解该事件？这些都是流程中需要回答的问题，并需要获得可靠的响应过程。流程必须中心化，并且可供参与工作负载的任何人使用。如果没有wiki 或文档存储，可以使用源代码版本控制机制。优先通过自动化响应事

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
PERF05-04 大数据场景资源优化 - 云架构中心

Flink等，将计算任务分配到多个节点上并行执行，以提高计算速度和效率。内存优化：通过调整内存分配和使用策略，如使用内存缓存、内存映射等技术，以提高数据处理和计算的速度和效率。负载均衡：通过负载均衡技术，将数据和计算任务均匀地分配到多个节点上，以避免单个节点过载，提高系统的可用性和性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
RES06-02 面向所有故障进行检测 - 云架构中心

障时，对外的呈现即为功能输出和预期不一致。在产品上线之前，通过功能相应接口，开发者和测试人员需要多次检测以保证模块功能的正确性。功能检测可以使用传统日志跟踪技术、调用链技术来进行检测，如华为云APM。业务检测：模拟用户的业务操作过程，获得完成业务的操作过程性能数据和操作结果数据

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
基础概念 - 云架构中心
基础概念 - 云架构中心

性能是指软件系统或软件对应其及时性要求的符合程度。及时性用响应时间或吞吐量来衡量。响应性响应性是系统实现其响应时间或吞吐量目标的能力。响应时间（RT）用户感受系统为其服务所耗费的时间。不同业务系统的响应时间期望值不同，如互联网业务多为500ms以下、金融业务1s以下等。可伸缩性可伸缩性是

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
OPS08-02 进行事故复盘和改进 - 云架构中心

优化事故的输入、输出，确保事故回溯工作有效开展，回溯报告中发现的问题有效整改，总结的经验有效推广。风险等级高关键策略故障发生后，通过对现网重大故障处理过程 Review 及根因进行分析和改进总结，规范整个恢复过程，实现对可用性和技术能力的提升。故障复盘的技术过程按照 RASA

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
RES11 可靠性测试 - 云架构中心
RES11 可靠性测试 - 云架构中心

内，达到预期的可靠性目标；与通常的功能测试不同，可靠性测试需要在业务负荷叠加故障中进行，对测试环境和能力提出了更高要求。可靠性测试和演练通过主动引入故障来充分验证软件质量的脆弱性，从而提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

RES11-04 灾难演练通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试

总条数： 326

上一页
1
...
8
9
10
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基础概念 - 云架构中心

参考案例 - 云架构中心

跨云双活方案 - 云架构中心

OPS06 可观测性体系 - 云架构中心

RES14 配置防差错 - 云架构中心

卓越运营支柱 - 云架构中心

RES10 故障隔离 - 云架构中心

选择合适网络服务资源 - 云架构中心

性能测试 - 云架构中心

RES14-03 变更前数据备份 - 云架构中心

RES13 过载保护 - 云架构中心

SEC01 云安全治理策略 - 云架构中心

性能数据采集 - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

基础概念 - 云架构中心

OPS08-02 进行事故复盘和改进 - 云架构中心

RES11 可靠性测试 - 云架构中心

RES11-04 灾难演练 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线