搜索_华为云

OPS05 运维准备和变更管理 - 云架构中心

OPS05 运维准备和变更管理 OPS05-01 进行生产准备度评审（Product Readiness Review） OPS05-02 进行变更风控 OPS05-03 定义变更流程父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES15 升级不中断业务 - 云架构中心

RES15-01 自动化部署和升级 RES15-02 自动化检查 RES15-03 自动化回滚 RES15-04 灰度部署和升级父主题：变更防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错
SEC09-03 实施安全审计 - 云架构中心

风险等级高关键策略云服务的关键操作包含高危操作（如创建IAM用户、删除IAM用户、重启虚拟机、变更安全配置等）、成本敏感操作（创建、删除高价资源等）、业务敏感操作（网络配置变更等）。启用关键操作通知功能。启用云审计服务CTS的关键操作通知功能后，CTS会对这些关键操作通过消

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 - 云架构中心

OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS02-01 进行需求管理和迭代开发 OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RES15-02 自动化检查 - 云架构中心

RES15-02 自动化检查在部署或升级过程中集成基本测试功能，实现自动化检查，无需人工参与。风险等级高关键策略在部署或升级过程中集成基本测试功能，在部署或升级完成后自动进行检查和测试，以验证新部署的代码功能是否正确。在部署或升级过程中集成故障注入测试功能，在部署或升

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES15-04 灰度部署和升级 - 云架构中心

回滚过程中的业务中断，提升系统可用性。风险等级高关键策略通过金丝雀部署、蓝绿部署等方式实现灰度升级或部署，逐步引入新版本部署范围或切换用户流量，配合自动回退以降低部署差错导致业务中断的风险。金丝雀部署（灰度发布）是将少量客户引导到新版本的做法，通常在单个服务实例（Can

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES05-01 网络连接高可用 - 云架构中心

网络链路冗余：网络连接需要支持多路径，以实现高可用能力，以避免在一条网络路径中断的情况下，业务能切换到其他路径继续通信。网络链路快速倒换：需要定期检查网络链路的连通性，但检测到失败时需要尽快切换到正常路径。公有云组网场景可通过多EIP 弹性IP及DNS域名解析实现网络连接的高可用；

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
RES02-02 自动数据备份 - 云架构中心

RES02-02 自动数据备份对于需要备份的数据，可根据该数据的RPO指标要求，设置定期备份策略进行自动备份。风险等级高关键策略使用华为云备份服务或第三方备份软件对数据进行备份，并可根据RPO要求设置自动备份频率。CBR云备份服务可对ECS/BMS/EVS/SFS Turbo

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
SEC03-03 定期审视权限 - 云架构中心

定期检视和更新权限，以避免权限蔓延，持续清理无用的权限。风险等级高关键策略使用IAM用户组控制人员的访问权限，并设置权限的到期时间。如果用户组的职责产生变化，应该及时调整用户组的权限。当账号委托给另一个账号时，设置到期时间。通过IAM用户的“最近一次登录时间”，判断该用户是否为长期未登录的用户，及时管理他们的身份凭证及权限。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

关键策略 Production Readiness Review 生产准备度评估基线：从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
OPS02-01 进行需求管理和迭代开发 - 云架构中心

据需求划分迭代计划。相关云服务和工具华为云CodeArts Req服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
PERF04-01 定义验收标准 - 云架构中心

能涉及响应时间、吞吐量、资源利用率或任何其他相关绩效指标的指标。例如响应时间的目标可能低于特定阈值，如小于2秒。定义验收标准将性能目标转换为可用于评估工作负载性能的特定验收标准。例如，假设响应时间的性能目标是2秒或更短。接受条件可以是工作负载的平均响应时间应小于2秒。使用这些

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

当程序运行在yarn-client模式下时，需要关注在driver端汇聚的数据量大小，根据自己的业务场景，为driver设置合理的内存。根据自己的业务目标，规划CPU资源和内存资源。规划时，需要结合当前的数据分布情况，业务复杂度，设置“executor-memory”，“executor-cores”，“Execu

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES03-04 支持容灾管理 - 云架构中心

下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。典型亚健康故障场景，支持业务降级或主动切换，业务不持续受损。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾

总条数： 132

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS05 运维准备和变更管理 - 云架构中心

RES15 升级不中断业务 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 - 云架构中心

常见故障模式 - 云架构中心

RES15-02 自动化检查 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

RES02-02 自动数据备份 - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

SEC03-03 定期审视权限 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

常见故障模式 - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

PERF04-01 定义验收标准 - 云架构中心

Spark性能优化 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线