搜索_华为云

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO 在进行容灾设计前，需要根据应用系统的重要性，明确其容灾目标，通常以RPO和RTO指标来定义： RPO：允许的数据丢失量，与数据的周期性复制周期或连续性复制延时相关。 RTO：允许的业务恢复时长，即业务中断时长，与灾备端业务的部署与切换方式相关。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
人工智能性能优化 - 云架构中心

人工智能性能优化 1.训练优化模型性能提升实践参数调优策略：调整模型flash attention、并行切分策略、micro batch size、重计算策略等参数。尽可能充分利用显存和算力，通过参数调优，初步优化性能。性能拆解参数调优后性能仍然与转商目标有较大的差距，需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度某平台服务的认证驾驶员用户1000万人，货主用户500万人，集团业务覆盖全国339个主要城市，覆盖线路数量超过11万条，实现了全国多中心运营的架构。客户痛点：多云双活场景运维难保障：大规模集群场景，单个云厂商灾备不足以保障业

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

电子传输及完整设备支持：少量数据丢失，备用数据系统就绪，数据定时传送，备用网络就绪数小时至2天数小时至1天 5 实时数据传输及完整设备支持：数据丢失趋于0，备用数据系统就绪，远程数据复制，备用网络就绪数分钟至2天 0至30分钟 6 数据零丢失和远程集群支持：数据零丢失，自动系统故障切换，远程磁盘镜像，备用网络active

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
RES13-01 采用自动弹性扩缩容 - 云架构中心

来改变系统的处理能力，称之为横向伸缩。系统设计时一般建议采用横向伸缩。采用横向伸缩时，要求业务与数据解耦，即将系统的业务处理逻辑与数据分离、数据（状态）外置，以实现业务节点（含资源）无状态，按需快速增加或减少，从而实现系统业务处理能力的伸缩。当节点故障或资源不足时，系统需要自

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

n主备容灾能力的实施步骤建议如下：选择另一个Region作为灾备Region，部署一套相同的应用系统，包括工作负载、数据库实例等。针对应用系统内的关键数据，利用云服务或应用系统自身实现跨Region的数据复制。若云服务实例支持跨Region容灾，则配置生产站点与灾备Regi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀针对无状态集群业务，通过负载均衡来保证业务均匀分发，可避免部分组件空闲，而部分组件过载而影响业务；同时还可以充分利用系统资源，提高系统性能，改善系统可靠性。风险等级高关键策略负载均衡分发业务粒度需避免过大，而导致部分组件过载。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
SEC01-05 实施威胁建模分析 - 云架构中心

实施威胁建模分析威胁建模是一种系统性的方法，用于识别和评估可能对系统或组织造成威胁的潜在威胁源、攻击路径和攻击手段。通过识别威胁理解系统的安全风险，发现系统设计中的安全问题，制定消减措施，降低系统风险，提升系统安全性和韧性。风险等级高关键策略以下是系统运行期间的威胁模型：该模型中涉及的概念如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
RES06-03 支持亚健康检测 - 云架构中心

RES06-03 支持亚健康检测系统内组件有可能完全故障，也有可能处于亚健康状态；亚健康是指系统整体业务未超标，但系统中局部实例业务超标。亚健康更多是个相对概念，相对历史表现的统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
SEC02-04 一体化身份管理 - 云架构中心

在公司范围内构建统一的身份管理系统，统一管理私有云和公有云、公有云上多个账号的用户身份。风险等级中关键策略在公司范围内构建统一身份管理系统，集中存储用户身份信息。统一身份管理系统与私有云、公有云平台的IAM系统进行身份联邦，统一身份管理系统中的用户身份可以同时访问私有云和公有云平台。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
OPS03-05 进行混沌测试和演练 - 云架构中心

Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成功处理的控制过程；典型过载控制方法定义如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
OPS06-06 实施分布式跟踪 - 云架构中心

编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时，标识符将被添加

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS06-01 建立可观测性体系 - 云架构中心

可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
可用性需求 - 云架构中心
可用性需求 - 云架构中心

根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的可用性目标明

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
设计原则 - 云架构中心
设计原则 - 云架构中心

分层保护：系统故障保护要考虑网络分层，下层的故障保护倒换要比上层灵敏，防止系统出现乒乓倒换。通过检测系统运行状态，或监控系统载关键指标，来判断系统是否发生故障，并针对故障可进行自动恢复处理。可以通过故障分析方法分析各种故障模式、影响及危害，设计对应的可靠可用方案，提供冗余、隔

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS04-03 基础设施即代码 - 云架构中心

装复杂的配置或资源组合。此外，在开发新模块时非敏感场景可以适当使用开源模块。标准化人工步骤：如果存在与部署和维护相关的人工步骤，要尽可能减少这类活动。在运维指南和标准操作程序中，清楚地记录人工步骤，并实现标准化，以确保安全、一致地执行任务。回收闲置资源：由于配置管理工具及其限制等原因，有时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程

总条数： 192

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

人工智能性能优化 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

RTO与RPO - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

SEC01-05 实施威胁建模分析 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

SEC02-04 一体化身份管理 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

可用性需求 - 云架构中心

设计原则 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线