搜索_华为云

RES15-04 灰度部署和升级 - 云架构中心

金丝雀部署（灰度发布）是将少量客户引导到新版本的做法，通常在单个服务实例（Canary）上运行；当检查到任何行为更改或错误时，可以将Canary中的流量删除，并将用户发回到以前的版本。如果部署成功，则可以继续以期望的速度进行部署，同时监控更改以便发现错误，直到所有部署完成。蓝绿部署与

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES12-03 定期应急恢复演练 - 云架构中心

定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
电商类应用典型部署架构（99.99%） - 云架构中心

电商类应用典型部署架构（99.99%）电子商务类应用用于外部客户，需要提供较高的可用性，并能承受组件故障，其可用性目标通常要求达到99.99%，即每年故障时间可以为52.56分钟。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断3次，每次应急恢复决策时长为10分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
OPS06-03 制定和实施可观测性指标 - 云架构中心

用，例如Prometheus、Grafana、Zabbix等，以及华为云提供的云监控服务CES。这些工具可以定期收集指标，提供可视化的指标报告，并且可以发送警报，以帮助组织及时发现问题。可参考CES的最佳实践，https://support.huaweicloud.com/be

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
更多参考文档 - 云架构中心
更多参考文档 - 云架构中心

更多参考文档华为云零信任能力成熟度模型白皮书企业上云安全白皮书华为云安全白皮书华为云隐私保护白皮书华为云服务的安全特性华为云安全配置基线指南父主题：安全性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
PERF02-02 容量规划 - 云架构中心

源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，例如需要存储大量的数据，可能需要选择分布式存储系统。网络带宽：根据预测的需求，计算所需的网络带宽，例如需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
应用管理与运维平台(ServiceStage) - 云架构中心

应用管理与运维平台(ServiceStage) 应用管理与运维平台（ServiceStage）是面向企业的应用管理与运维平台，提供应用发布、部署、监控与运维等一站式解决方案。支持Java、Php、Python、Node.js、Docker、Tomcat技术栈。支持Apache ServiceComb

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
OPS04-01 有效落地持续集成 - 云架构中心

个基线和测试来验证代码。然后，它向提交者提供有关这些测试状态的反馈。如果基线检查和测试进展顺利，集成过程将生成并暂存部署更新软件的资产。这些资产包括编译的代码和容器映像。持续集成可以通过执行以下操作更快地交付高质量的软件：针对代码运行自动化测试，以便尽早检测到重大更改。运行代码分析以确保代码标准、质量和配置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
云日志服务(LTS) - 云架构中心
云日志服务(LTS) - 云架构中心

云日志服务(LTS) 云日志服务（Log Tank Service，简称LTS）是高性能、低成本、功能丰富、高可靠的日志平台，提供全栈日志采集、百亿日志秒搜、PB级存储、日志加工、可视化图表、告警和转储等功能，满足应用运维、等保合规和运营分析等应用场景需求。云日志服务提供多种接

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

要求，降低管理成本。资源管理：同步并纳管用户在云平台上使用的资源实例，构筑资源运维能力底座。配置管理：提供应用和资源视角的管理能力，以及参数配置集中式看护、全生命周期管理的能力。合规性管理：资源运维提供批量的补丁扫描修复能力，安全合规先行，兼顾高效。全方位变更管理方案评

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
应用运维管理(AOM2.0) - 云架构中心

Management，简称AOM）是云上应用的一站式立体化运维管理平台，融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源，提供应用资源统一管理、一站式可观测性分析和自动化运维方案，帮助用户及时发现故障，全面掌握应用、资源及业务的实时运行状况，提升企业海量运维的自动化能力和效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
OPS05-02 进行变更风控 - 云架构中心

）时引发的业务中断风险及变更失败可能导致的业务受损风险。设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月变更导致对客户造成影响的事件数与总变更数的比值。计算公式：变更导致事件密度=变更导致对客户造成影响的事件数/总变更数。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES07-03 监控到异常后发送消息通知 - 云架构中心

监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份，避免单点风险。 SMN消息通知

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
SEC10-01 建立安全响应团队 - 云架构中心

安全响应专家：主导网络安全事件调查，负责对事件进行定级、通报、攻击溯源以及确定影响范围，制定应急处置措施，推动服务控制风险。攻击溯源专家：根据攻击的IOC信息进行溯源，追溯攻击者信息，攻击范围（无遗漏），攻击溯源图（攻击路径）和攻击溯源报告，确认攻击事件性质。高级分析专家：漏洞分析及复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES06-02 面向所有故障进行检测 - 云架构中心

针对具体故障进行检测时，根据检测的类型通常可以分为资源检测、功能检测和业务检测。资源检测：云环境中一般指虚拟化后的物理硬件资源及其对应的软件资源，具体包含CPU、内存、网络和磁盘资源等。功能检测：对组成产品系统的各个内部模块对象进行检测的过程，确定模块功能是否满足设计的需求。当产品系统的功能发生故

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES13-03 过载检测与流量控制 - 云架构中心

相关云服务和工具华为云提供了一些内嵌流控保护的云服务，用户可直接配置使用： API网关 APIG：支持配置流控策略，用户可指定单位时间内的单个API、单个用户或单个APP的请求次数上限。微服务引擎 CSE：支持限流，用户可指定一定时间内可接受的请求次数上限。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

保存期限无限制。 DCS指定备份集恢复。恢复过程中，实例会有一段时间不能处理客户端的数据操作请求，当前数据将被删除，待恢复完成后存储原有备份数据。详见“备份与恢复说明”。跨AZ容灾 DCS提供的主备、Cluster集群、Proxy集群实例支持跨AZ容灾，当一个AZ异常时，另一

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
RES03-04 支持容灾管理 - 云架构中心

RES03-04 支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾

总条数： 261

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES15-04 灰度部署和升级 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

电商类应用典型部署架构（99.99%） - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

更多参考文档 - 云架构中心

PERF02-02 容量规划 - 云架构中心

应用管理与运维平台(ServiceStage) - 云架构中心

OPS04-01 有效落地持续集成 - 云架构中心

云日志服务(LTS) - 云架构中心

云运维中心(COC) - 云架构中心

RES07-02 日志统计监控 - 云架构中心

应用运维管理(AOM2.0) - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

SEC10-01 建立安全响应团队 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线