检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
启动WarRoom 操作场景 事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
ceCatalogEndUserFullAccessPolicy策略。 启动产品 登录云运维中心。 在左侧导航栏选择“资源管理 > 服务目录”。 单击“产品”。 选择需要启动的产品,单击操作列“启动产品”。 设置“启动产品”。 表1 启动产品参数说明 参数 说明 实例名称 根据命名规则,自定义实例的名称。
如果选择攻击目标来源为云容器引擎 (CCE),则需要选择应用、选择pods(依次选择集群、选择namespace、选择工作负载类型、选择工作负载),可以指定pod或者指定数量,单击“下一步”。 图14 选择攻击目标为云容器引擎 (CCE),指定pod 图15 选择攻击目标为云容器引擎 (CCE),指定数量
单击“完成配置”,完成演练任务创建。 步骤四:启动演练 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。 单击“演练任务”页签,进入演练任务页面。 找到步骤三中创建的演练任务,单击操作列“启动演练”。 图7 启动演练 了解风险提示后,单击“确认”,进入演练记录详情页面。
注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 选择需要查看资源所在的云厂商。 默认选择“华为云”。
移动应用管理 操作场景 移动应用管理用于管理事件启动WarRoom时,创建企业微信WarRoom作战室必要的企业微信配置信息,用户可通过移动应用管理页面管理企业微信的配置信息。 查看移动应用 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。当该租户已绑定企业微
删除实例 操作场景 启动产品生成实例后,如果需要删除,请按如下操作进行。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 删除实例 登录云运维中心。 在左侧导航栏选择“资源管理
WarRoom状态 操作场景 WarRoom启动后,在处理故障过程中需查看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理
Warroom是什么? 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
可选参数。选择排班角色,其中的排班人员在启动WarRoom时会被自动加入到第三方移动应用群组。 配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,匹配
华北-乌兰察布一(cn-north-9) 华北-乌兰察布-汽车一(cn-north-11) 西南-贵阳一(cn-southwest-2) 云容器引擎 CCE 集群(cce.clusters) 华北-北京四(cn-north-4) 华南-广州(cn-south-1) 华东-上海一(cn-east-3)
跳过步骤8,执行步骤9。 设置“执行作业”。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。 所有步骤一致:所有任务在所选目标实例执行,统一使用一个分批策略。 每个步骤独立:单个步骤下的任务在所选目标实例执行,每个步骤使用一个分批策略。 每个任
在弹框中单击“确认”,即可删除演练任务。 图4 删除演练任务 启动演练 对已经创建的演练任务,启动演练。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 在演练任务列表的“操作”列,单击“启动演练”,进入“演练记录详情”页面。 图5 启动演练 在“演练详情”页面
补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器ECS和裸金属服务器BMS场景默认补丁基线,如需使用云容器引擎CCE场景下补丁基线功能请手动创建。
管理员为终端用户授予产品的启动和访问权限。 终端用户查询并启动产品。启动产品后,将生成一个资源栈,便于管理产品相关的云资源。 终端用户在服务目录控制台按需管理云资源。 基本概念 概念 说明 管理员 管理员负责创建、管理和授权产品。 终端用户 终端用户可以查询、启动被授权后的产品,生成云资源。
若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。 处理流程 Warroom处理流程如下: 启动Warroom:在事件管理处理事件页面启动WarRoom。 故障定界和恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位
流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多监控源纵向抑制、横向收敛,进行多维降噪;支持每个流转规则配置事件时默认分配对象和通知策略,而实现更准确的通知。 Global 集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控
WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。
、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和启动了WarRoom所有级别的事件需进行复盘,该规则可在故障复盘规则中修改。 故障复盘 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击“全部事件单”页签。
单击是否开启列按钮。 完成故障复盘规则开启或关闭。 修改规则 仅管理账号可修改复盘规则。 默认规则: 启动Warroom的事件单,P1, P2, P3, P4, P5均需复盘; 未启动Warroom的事件单,P1, P2, P3, P4需进行复盘。 登录COC。 在左侧导航栏选择“基础配置