搜索_华为云

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

关联源代码版本和部署的应用版本，使用代码质量最佳实践风险等级高关键策略在代码开发阶段，需要开展代码协作设计和管理。使用现代化的代码仓管理代码，确保代码合并后，代码将保持一致，并且不会丢失任何更改。通过正确的版本控制，同时，现代化的代码仓可以方便设置代码版本，关联源代码版本和部署的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
设计原则 - 云架构中心
设计原则 - 云架构中心

设计原则建立持续改进的团队文化和标准化运维体系在卓越运营中，团队文化建设至关重要。运营是一门不断改进的艺术。只有不断从已有事故中学习经验，持续学习和改进，才能最终达到卓越运营。故而，团队应该培养持续学习和改进的文化，此外，在事故发生时，应该以对事不对人的态度，思考系统的改进，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 OBS桶流量过载检测：通过CES监控请求数、请求成功率、上传/下载带宽等流量指标。恢复：应用层调整批量业务，避免业务高峰期进行备份等业务；应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
PERF06-01 分层看护 - 云架构中心

一般、紧急、重要三个梯度，对应每个梯度的指标配套对应的处理措施。对于敏感度或业务重要度的应用架构，可以新增一个提示级别的梯度。相关云服务和工具：云监控服务 CES 应用运维管理 AOM 应用性能管理APM 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
RES04 跨Region/跨云容灾 - 云架构中心

RES04 跨Region/跨云容灾为了预防区域级灾难发生，或业务跨云容灾需求，需要构建容灾系统提供较为完善的数据保护与灾难恢复能力，以便在站点级灾难发生时，可以保证生产系统的数据尽可能少的丢失，业务系统能在最短时间内由灾备中心接替，恢复业务系统的正常运行，将损失降到最小。对

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
SEC09-02 安全事件记录及分析 - 云架构中心

在发生安全事件之前，可以考虑构建取证能力来支持安全事件调查工作。记录攻击和异常行为并对其分析：应在关键网络节点处检测、防止或限制网络攻击行为；应采取技术措施对采集的安全日志进行持续监控和分析，实现对网络攻击特别是新型网络攻击行为和异常行为的识别和分析。基于安全事件进行攻击链分析和攻击溯源, 包含攻击的各个路径，初始

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
PERF02-02 容量规划 - 云架构中心

确定资源需求根据需求和预测分析的结果，进行容量评估和规划。确定系统所需的计算资源、存储资源和网络带宽等资源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
DMS分布式消息服务 - 云架构中心

Kafka版：基于开源社区版Kafka提供的消息队列服务，向用户提供计算、存储和带宽资源独占式的Kafka专享实例。 RabbitMq版：完全兼容开源RabbitMQ，提供即开即用、消息特性丰富、灵活路由、高可用、监控和告警等特性，广泛应用于秒杀、流控、系统解耦等场景。 RocketMQ版

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
OPS07-01 创建可操作的告警 - 云架构中心

/var/log/messages 中，根据关键字匹配硬件类告警，以便及时处理。相关云服务和工具应用运维管理 AOM 云运维中心 COC 云监控服务 CES 父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES13-03 过载检测与流量控制 - 云架构中心

熔断：在分布式系统中，应用调用第三方资源和服务时由于第三方资源和服务故障（包括过载）而失败，停止调用远程资源和服务，避免故障扩散。相关云服务和工具华为云提供了一些内嵌流控保护的云服务，用户可直接配置使用： API网关 APIG：支持配置流控策略，用户可指定单位时间内的单个API、单个用户或单个APP的请求次数上限。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
OPS06-03 制定和实施可观测性指标 - 云架构中心

OPS06-03 制定和实施可观测性指标风险等级高关键策略指标是对时间周期内的测量数据的数值表示。可观测性指标是围绕发现率、定级准确率、定界时长、覆盖率、有效率、一致率打造可观测能力，将可观测设计规范统一发布，统一设计要求与运维管理要求。设计建议整体技术方案会变成标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES08 依赖减少与降级 - 云架构中心

RES08 依赖减少与降级对于应用系统，需要识别和管理系统依赖项。应用系统设计人员需要维护对其他系统组件的依赖项的完整列表，包括系统内和系统外的所有依赖。应用系统应尽可能减少关键依赖项，即减少由于该依赖项不可用而导致服务中断的组件。 RES08-01 减少强依赖项 RES08-02

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
SEC03-01 定义权限访问要求 - 云架构中心

件，选择用于进行身份验证和授权的适当身份类型和方法。风险等级高关键策略使用IAM角色来定义应用程序和组件对资源的访问权限。通过构建最低权限访问模型，确保只授予必要的权限。根据用户的角色和职责分配权限，确保用户只能访问其工作所需的资源。相关云服务和工具统一身份认证服务 IAM

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
SEC10-03 自动化响应安全事件 - 云架构中心

定义响应触发条件：基于威胁情报、异常行为检测和实时监测的结果，确定哪些情况会触发自动化响应。制定响应策略：为每种类型的威胁或事件制定具体的响应动作，例如隔离、修复、通知、调查等。优先级与分级：根据事件的严重性和紧急程度，定义响应的优先级，确保重要事件得到优先处理。持续监控：利用SIEM（安全信息和事件管理）

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES07-02 日志统计监控 - 云架构中心

关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。相关云服务和工具云日志服务 LTS 父主题： RES07 监控告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES10-03 采用Grid架构 - 云架构中心

id，使用全映射会带来对映射表的严重读写依赖，读写一致性要求考虑，通常需要引入meta data service。基于前缀和范围mapping：基于前缀和范围的映射，将键范围映射到Grid，并在提供灵活性的同时，弥补了Full-Mapping的不足。 Mapping代替：强制将

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
OPS03-05 进行混沌测试和演练 - 云架构中心

等能力做“在线验证”，实现持续性的动态风险治理。混沌演练和高可用设计共同成为系统稳定性的“双引擎”。系统风险消减、业务快速恢复：分析系统潜在风险（故障场景），制定应急预案，验证故障场景的覆盖率和命中率，验证应急预案的质量和执行效率，做到“少出事”和“出了事快速恢复”，实现确定性恢复的目的。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
SEC02-04 一体化身份管理 - 云架构中心

联邦，统一身份管理系统中的用户身份可以同时访问私有云和公有云平台。统一身份管理系统与公司的HR流程结合，当员工入职、调岗和离职时可以触发用户的创建、变更和删除。针对Landing Zone搭建的云上多账号环境，利用IAM身份中心集中管理多个账号的用户身份，并集中为这些用户配置

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
LTS助力某公司高效完成日常业务运维与等保合规 - 云架构中心

云服务资源种类数量较多，监控指标和运维日志不熟悉，运维难度大等保合规要求日志长时间存储，运维部门较多，人员不足，自建ELK成本高解决方案：业务价值：全量日志接入：汽车APP、软件开发、流量平台等170个业务系统接入云日志服务，全面覆盖业务、应用、中间件和基础设施。分钟级问题定界

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例

总条数： 208

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

设计原则 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

PERF06-01 分层看护 - 云架构中心

RES04 跨Region/跨云容灾 - 云架构中心

SEC09-02 安全事件记录及分析 - 云架构中心

PERF02-02 容量规划 - 云架构中心

DMS分布式消息服务 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

RES08 依赖减少与降级 - 云架构中心

SEC03-01 定义权限访问要求 - 云架构中心

SEC10-03 自动化响应安全事件 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

SEC02-04 一体化身份管理 - 云架构中心

LTS助力某公司高效完成日常业务运维与等保合规 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线