搜索_华为云

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：降低了运维成本与难度：降低了运维多套系统的难度，减少了客户运维起步的资源投入，降低了运维成本运营分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
SEC02-01 对账号进行保护 - 云架构中心

账号是华为云租户的账号体系中权限最高的用户，拥有对整个云环境的最高权限。一旦账号受到攻击或泄露，可能导致严重的安全问题和数据泄露。因此，身份认证的安全性首先要考虑对此账号进行保护。风险等级高关键策略强密码：使用强密码来保护账号，包括数字、字母、特殊字符的组合，并确保密码足够长且复杂。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
RES09-01 API及命令调用需要设计为可重试 - 云架构中心

次重复执行，需要保证重复执行多次的结果不变。风险等级高关键策略应用系统在设计时，应使操作具有幂等性，也就是允许一个操作连续执行两次或多次时，应该与单次调用产生的结果相同，从而保证重试安全；若不支持操作的幂等性，会导致客户端难以重试或重试的处理更复杂。父主题： RES09

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
RES04-03 容灾恢复过程自动化 - 云架构中心

RES04-03 容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS04-02 采用持续部署模型 - 云架构中心

选择这两种模型时，部署的每个阶段之间的时间应该足够长，以便能够监控工作负载的运行状况指标。应该提供充足的部署间隔时间（即部署组之间的时间），以确保来自不同区域的用户或执行不同任务的用户有时间使用工作负载。间隔时间应以小时和天而不是分钟来衡量。每个部署组的间隔时间也应该增加，以便考虑不同的时区和使用模式。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

部署容灾系统以满足容灾目标针对不同应用系统的容灾目标，需要综合考虑中断概率、容灾成本等因素，来决定采用什么样的容灾方案来实现这些目标。风险等级高关键策略面向跨Region/跨云容灾场景，可基于不同的可用性目标要求，采用不用的容灾方案，如远程备份、主备容灾、双活容灾等，其

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES07-02 日志统计监控 - 云架构中心

设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。相关云服务和工具云日志服务 LTS 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES02-03 定期进行备份数据恢复 - 云架构中心

RES02-03 定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建一个测试环境，并使用已有的备份数据进行恢复处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
设计原则 - 云架构中心
设计原则 - 云架构中心

单点故障会导致整个系统崩溃、主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患，因此系统的高可用设计非常关键。高可用设计的主要手段是冗余，甚至是多级冗余的组合，包括异地容灾方式保证灾难情况下无单点：冗余机制：只要条件允许，需要考虑关键组件的冗余，甚至是多级冗余的组合（例如：1+1冗余、n+1冗余、N-Way冗余等）

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
CCE云容器引擎 - 云架构中心
CCE云容器引擎 - 云架构中心

云容器引擎（Cloud Container Engine，简称CCE）提供高度可扩展的、高性能的企业级Kubernetes集群，支持运行Docker容器。借助云容器引擎，可以在云上轻松部署、管理和扩展容器化应用程序。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
基础概念 - 云架构中心
基础概念 - 云架构中心

基础概念基本概念名称名词解释 FinOps FinOps 是 Finance 和 DevOps 的合成词，强调 IT、财务和业务团队必须协作，将财务责任引入云，并在速度、成本和性能之间做权衡时做出数据驱动的明智决策。 CFM 华为云云财务管理（Cloud Financial Man

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
SEC10-05建立复盘机制 - 云架构中心

包括事件发生的时间、地点、责任人、事件的过程、原因、影响等。组建复盘团队：邀请相关的团队成员和利益相关者参与复盘过程。确保涵盖各个关键领域的代表，如技术人员、安全运营人员等。分析根本原因：通过结果追溯分析事件的根本原因，连续问几个为什么，找出导致事件发生的最根本的问题。这有助于避免将来类似事件的发生。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES10-03 采用Grid架构 - 云架构中心

rid，使用全映射会带来对映射表的严重读写依赖，读写一致性要求考虑，通常需要引入meta data service。基于前缀和范围mapping：基于前缀和范围的映射，将键范围映射到Grid，并在提供灵活性的同时，弥补了Full-Mapping的不足。 Mapping代替：强制

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES12-03 定期应急恢复演练 - 云架构中心

定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具云运维中心 COC：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
性能数据采集 - 云架构中心
性能数据采集 - 云架构中心

性能数据采集收集性能数据是收集指标和日志的过程，这些指标和日志提供有关工作负载性能的信息。此数据包括数值，称为指标。指标描述系统在特定时间点的状态。它还包括包含组织成记录的不同类型的数据的日志。通过收集性能数据，可以监视和分析工作负载的性能。可以使用此信息来识别性能瓶颈

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析
RES05 网络高可用 - 云架构中心
RES05 网络高可用 - 云架构中心

业务中断，因此网络架构的高可用及容灾能力至关重要。在进行网络设计时，需要充分考虑应用系统对内和对外的网络连接、IP地址管理和域名解析等。华为云中网络高可用主要涉及三个场景：公有云网络：构建应用系统相关的公网网络连接的高可用，可减少由于网络连接中断而导致的业务中断。混合云网络

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
应用管理与运维平台(ServiceStage) - 云架构中心

应用管理与运维平台(ServiceStage) 应用管理与运维平台（ServiceStage）是面向企业的应用管理与运维平台，提供应用发布、部署、监控与运维等一站式解决方案。支持Java、Php、Python、Node.js、Docker、Tomcat技术栈。支持Apache ServiceComb

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
韧性支柱 - 云架构中心
韧性支柱 - 云架构中心

韧性支柱韧性支柱简介基本概念设计原则问题和检查项高可用设计故障全面检测故障快速恢复过载控制变更防差错参考架构云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践

总条数： 330

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

SEC02-01 对账号进行保护 - 云架构中心

RES09-01 API及命令调用需要设计为可重试 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

设计原则 - 云架构中心

CCE云容器引擎 - 云架构中心

基础概念 - 云架构中心

SEC10-05建立复盘机制 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

性能数据采集 - 云架构中心

RES05 网络高可用 - 云架构中心

应用管理与运维平台(ServiceStage) - 云架构中心

韧性支柱 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线