搜索_华为云

OPS01-02 规划标准化的运维组织 - 云架构中心

此外也可以使用DevOps模式，由开发工程师直接运维系统，而保留一个小而精干的卓越运营使能团队，用于负责组织整体的卓越运营流程改进和相应的流程工具落地。无论如何设立组织，应该确保具有一个整体的流程，在流程中的每个团队和成员都有自己明确的责任。同时可以使用明确的方式（如收集运营/运维数据）分析团队

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
RES15-04 灰度部署和升级 - 云架构中心

限于升级和回滚的时长，对业务影响比较大；而采用灰度部署和升级，可减少升级和回滚过程中的业务中断，提升系统可用性。风险等级高关键策略通过金丝雀部署、蓝绿部署等方式实现灰度升级或部署，逐步引入新版本部署范围或切换用户流量，配合自动回退以降低部署差错导致业务中断的风险。金丝雀

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 OBS桶流量过载检测：通过CES监控请求数、请求成功率、上传/下载带宽等流量指标。恢复：应用层调整批量业务，避免业务高峰期进行备份等业务；应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

常见的简单表达方式用“9”的数量或“9”的数量加“5”表示，如“三个9”表示“99.9%”，而“三个9一个5”表示“99.95%”。系统可用性目标通过服务等级目标（SLO）定义。不同的应用系统对可用性目标是不同的，明确应用系统的可用性目标，对于衡量应用系统的韧性至关重要。常见IT系统SLO示意如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
选择合适的计算资源 - 云架构中心

资源，并防止在低需求时段过度预配。考虑容器化与非容器化工作负载相比，容器具有性能优势。如果适合体系结构需求，请考虑使用容器化。容器可以通过隔离、资源效率、快速启动时间和可移植性来提高计算性能。使用容器时，请考虑设计因素，例如将所有应用程序组件容器化。将基于Linux的容器运

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
RES12 应急恢复处理 - 云架构中心

RES12 应急恢复处理应用系统无论如何精心设计，仍可能会出现无法恢复的故障，当此类故障发生后，需要进行应急恢复处理。 RES12-01 组建应急恢复团队 RES12-02 制定应急预案 RES12-03 定期应急恢复演练 RES12-04 出现问题后尽快恢复业务 RES12-05

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

企业可在成本中心查看可分配成本比例，并通过该指标诊断标签覆盖率和牵引企业内部治理标签。企业可通过成本中心、TMS、云服务控制台来识别和治理未打标签资源，标签Key&value错误客户可通过Config服务预设的资源合规策略，识别资源标签为空等不合规场景。客户可通过Organization

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
RES14-03 变更前数据备份 - 云架构中心

RES14-03 变更前数据备份通过配置数据事前备份与恢复设计，确保在出现配置错误时能够快速恢复到正确的配置数据状态。风险等级高关键策略进行全量数据备份，以防变更过程中数据被破坏，影响业务。异常回滚时，可使用备份数据进行恢复。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
PERF05-04 大数据场景资源优化 - 云架构中心

Flink等，将计算任务分配到多个节点上并行执行，以提高计算速度和效率。内存优化：通过调整内存分配和使用策略，如使用内存缓存、内存映射等技术，以提高数据处理和计算的速度和效率。负载均衡：通过负载均衡技术，将数据和计算任务均匀地分配到多个节点上，以避免单个节点过载，提高系统的可用性和性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
设计原则 - 云架构中心
设计原则 - 云架构中心

执行情况。对于构建在云上的应用，通过可观测性，可以快速发现和解决系统故障，从而提高系统从故障中的恢复速度。进一步地，可以提前发现系统的问题，例如性能，容量瓶颈，提前解决问题。更进一步地，您可以通过联动可观测性带来的告警和上文中的自动化流程，通过主动式响应，包括动态缩扩容，流控，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
OPS08-02 进行事故复盘和改进 - 云架构中心

优化事故的输入、输出，确保事故回溯工作有效开展，回溯报告中发现的问题有效整改，总结的经验有效推广。风险等级高关键策略故障发生后，通过对现网重大故障处理过程 Review 及根因进行分析和改进总结，规范整个恢复过程，实现对可用性和技术能力的提升。故障复盘的技术过程按照 RASA

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
卓越运营支柱简介 - 云架构中心

能上，减少用于维护和处理突发事件的时间，从而带来运行良好的系统和平衡的工作负载，尤其是卓越的客户体验。卓越运营支柱融合了这些优秀实践，聚焦如何正确地构建软件，高效地运维软件，持续提供卓越的客户体验，包含：组织团队、设计工作负载、大规模运营工作负载和随时间变化改进工作负载的最佳实践。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
SEC01-01建立安全管理团队 - 云架构中心

员应遵守这些政策和流程，确保安全管理的一致性和有效性。建立应急响应计划：开发和测试应急响应计划，以应对安全事件和紧急情况。团队应清楚知道如何应对安全威胁和处理安全事件。父主题： SEC01 云安全治理策略

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
设计原则 - 云架构中心
设计原则 - 云架构中心

变更防差错通常采用以下方案：角色约束：通过权限控制设计预防对不同角色的配置范围进行约束，避免越权配置导致错误。查改分离：通过产品界面设计将配置界面分层分级，查看与修改分离等降低人为配置失误风险。配置校验：通过配置生效机制设计确保在配置生效前进行必要的检查，避免错误配置生效。通过使用自动化方式进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
概念表 - 云架构中心
概念表 - 云架构中心

确保只有授权的用户可以访问系统中的敏感信息，防止未经授权的访问和泄露。机密性通常通过加密技术来实现，包括对数据进行加密和解密的过程，确保只有授权用户能够访问和理解数据内容。完整性确保数据在传输和存储过程中不被篡改，保持数据的完整性，防止数据被恶意篡改或损坏。完整性通常通过哈希函数和数字签名等技术来实现，确保数据在传输或存储过程中没有被篡改或损坏。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基本概念
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
SEC01-06 识别并验证安全措施 - 云架构中心

的安全措施进行验证，以确保它们按照预期方式运行并有效地保护系统，从而缓解或消除安全威胁。风险等级高关键策略依据系统的安全设计文档，通过验证确保安全措施被正确地集成到系统中，并符合最佳实践和标准。尽早检视系统的代码（此过程称为代码白盒安全检视），确保代码符合安全最佳实践，避免在后续阶段发现严重的安全漏洞。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略

总条数： 225

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS01-02 规划标准化的运维组织 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

可用度及SLO - 云架构中心

选择合适的计算资源 - 云架构中心

RES12 应急恢复处理 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

RES14-03 变更前数据备份 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

设计原则 - 云架构中心

常见故障模式 - 云架构中心

OPS08-02 进行事故复盘和改进 - 云架构中心

卓越运营支柱简介 - 云架构中心

SEC01-01建立安全管理团队 - 云架构中心

设计原则 - 云架构中心

概念表 - 云架构中心

常见故障模式 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

SEC01-06 识别并验证安全措施 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线