检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备
概述 在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组
概述 应用韧性评估用于衡量应用在面对各种干扰和压力(如硬件故障、网络波动、流量峰值、安全攻击等)时,能够维持正常功能和性能的评估方式。韧性的概念不仅仅局限于恢复能力,还包括预防问题、快速检测问题以及有效应对问题的能力。 COC应用韧性评估基于华为最佳实践经验,定义了300+的评估
什么是云运维中心 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。
一站式资源运维 实践场景 某电商运维人员在日常工作中发现,云上资源合规性问题突出,OS合规性风险尤为明显,引发客户对云上OS安全合规性担忧;需要周期性检查主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修
运维态势感知 前提条件 如果您是在单账号场景下使用运维态势感知,您可跳过此部分内容,查看操作步骤。 如果您是在跨账号场景下使用运维态势感知,需要满足以下前提条件: 1、当前账号已经开启跨账号管理,并且是组织/委托管理员账号。 2、组织成员账号已开通云运维中心COC服务。 操作场景