搜索_华为云

可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到OBS中，以便在缓存实例发生异常后能够从备份数据进行恢复。DCS实例支持定时和手动两种

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
OPS06-04 规范化应用日志 - 云架构中心

OPS06-04 规范化应用日志日志是随时间推移发生的不可变、记录时间戳的离散事件。系统需要记录关键事件和故障，以帮助诊断问题和解决故障。风险等级高关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
卓越运营支柱简介 - 云架构中心

高质量的交付结果，推动了持续集成和持续交付（CI/CD）落地；同时助力打造确定性运维体系，让研发团队将更多时间用在构建让客户受益的新功能上，减少用于维护和处理突发事件的时间，从而带来运行良好的系统和平衡的工作负载，尤其是卓越的客户体验。卓越运营支柱融合了这些优秀实践，聚焦如何正确

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
设计原则 - 云架构中心
设计原则 - 云架构中心

维体系。非标是大规模运维的头号天敌，主要表现是运维无序，团队成员依靠自身技术各自为战，处于被动响应和疲于应付的工作状态，效率低下，人为失误多，故障处理难度大。标准化运维体系是对有效经验总结后，运维活动例行化的高效管理。通过对运维活动的标准化、流程化和工具化管理，实现从无序向有序演

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES02-03 定期进行备份数据恢复 - 云架构中心

RES02-03 定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
SEC06-03 实行代码白盒检视 - 云架构中心

中，团队成员会检查代码的质量、安全性、可读性等方面，以发现潜在的问题和改进空间。风险等级中关键策略制定检视计划：确定检视的频率和时间安排，以确保代码检视是持续的活动。确定检视范围，例如可以是每次提交、每个功能完成后，或者定期的大规模检视。培训团队成员：提供培训以确保团队成员了解如何进行有效的代码检视。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
OPS06-03 制定和实施可观测性指标 - 云架构中心

OPS06-03 制定和实施可观测性指标风险等级高关键策略指标是对时间周期内的测量数据的数值表示。可观测性指标是围绕发现率、定级准确率、定界时长、覆盖率、有效率、一致率打造可观测能力，将可观测设计规范统一发布，统一设计要求与运维管理要求。设计建议整体技术方案会变成标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
SEC10-03 自动化响应安全事件 - 云架构中心

SEC10-03 自动化响应安全事件自动化的响应工作流是安全自动化的核心组成部分，旨在减少安全事件的响应时间，并提高处理效率。风险等级高关键策略定义响应触发条件：基于威胁情报、异常行为检测和实时监测的结果，确定哪些情况会触发自动化响应。制定响应策略：为每种类型的威胁或

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

比如对于核心业务，通常需要保障业务的连续性，允许业务中断的时间会比较少，从而需要保障故障场景下的业务快速恢复，可采用双活/多活容灾；对于重要业务，允许一定的业务中断时间，可采用主备容灾；对于一般业务，允许中断的业务时间可达到天级，则可采用远程备份；对于一些不重要的业务，其业务中

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

到备份点。由于容灾通常对数据采用实时复制且没有多备份点，在主数据被误删或误改的情况下，错误数据会同步到备端，从而无法达到数据备份的效果，因此通常不能使用容灾来代替备份。备份恢复时的RPO指标（即数据丢失量），与最近一个备份时间点相关；不同类型的数据，允许丢失数据量可以不同，即

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
PERF03-07 选择合适的Kafka - 云架构中心

PERF03-07 选择合适的Kafka 风险等级中关键策略根据生产流量、消费流量、老化时间、副本数等指标，计算业务所需的规格，选择合适的Kafka规格。规格测算：性能容量维度所需最小节点数 = max（（存储带宽需求 / 单节点存储带宽），（网络带宽需求 / 单节点网络基准带宽））

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
COST07-02 释放闲置资源 - 云架构中心

风险等级中关键策略持续监控资源的闲置情况（如ELB无流量，EVS盘无挂载，EIP没有绑定到虚机），释放资源，或者监控资源使用只是在某个固定的时间(如每天的十二点，每个周末），可以使用自动化的方式定期申请资源，使用后释放相关服务和工具华为云优化顾问，提供成本维度的巡检，识别ECS、EIP、EVS、ELB等闲置资源。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点风险等级中关键策略服务器资源就类似一块块资源拼成的木桶，其最多能承载的业务需求取决于哪一块资源最先达到瓶颈。不同应用对资源需求不同，例如：功耗密集型业务（如高性能计算、人工智能、深度学习等场景）主要就是消耗计算维度的容量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

批处理业务批处理主要特点是耗时时间长，消耗的资源比较多，主要的调优和设计推荐如下：尽量使用ORC File，配上合适的压缩算法，主要可选的压缩算法为Zlib和Snappy。其中Zlib压缩比高，但压缩解压时间比Snappy长，消耗资源比如Snappy多。Snappy平衡了的压缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
PERF05-01 设计优化 - 云架构中心

们的处理时间，在给定时间范围内，随机分散到不同时间，以解决这个问题。空间换时间通过使用更多的存储空间，以节省执行时间。空间换时间包括简单地预先存储结果，或者存储经常被访问的数据以方便计算；另一种空间换时间则包括选择特定的算法，如HASH算法就是一种典型的空间换时间的算法。另

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 设计优化
SEC02-03 安全管理及使用凭证 - 云架构中心

K或API。如果某些情况下不能选择临时凭证，才使用长期凭证。在此情况下，建议将长期凭证放置到代码之外的文件或由第三方托管，将长期凭证作为变量传入使用。要定期审计和实施凭证轮换，以帮助降低长期凭证相关风险。对您的身份提供者和IAM中配置的身份进行审计，这有助于验证只有经过授权的身份才能访问您的工作负载。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
OPS08-01 使用度量指标衡量运营目标 - 云架构中心

临的挑战。并明确运营目标的关键绩效指标 (KPI)，可能是客户满意度、TTM、平均问题解决时间等等。根据 KPI，识别关键指标和数据源。客户满意度可能是各种指标的组合，例如呼叫等待或响应时间、满意度评分以及提出的问题类型。父主题： OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
信息管理类应用典型部署架构（99.95%） - 云架构中心

信息管理类应用典型部署架构（99.95%）信息管理类应用通常用于内部操作，且在故障时只会对内部员工造成影响，可以承受一定的恢复时间和恢复点，其可用性目标通常要求达到99.95%，即每年故障时长可以为4.38小时。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构

总条数： 114

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可靠性功能 - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

卓越运营支柱简介 - 云架构中心

设计原则 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

SEC06-03 实行代码白盒检视 - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

SEC10-03 自动化响应安全事件 - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

RES02 备份 - 云架构中心

PERF03-07 选择合适的Kafka - 云架构中心

COST07-02 释放闲置资源 - 云架构中心

RES11-03 长稳测试 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

HIVE优化 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

PERF05-01 设计优化 - 云架构中心

SEC02-03 安全管理及使用凭证 - 云架构中心

OPS08-01 使用度量指标衡量运营目标 - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线