检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
启动WarRoom 操作场景 重大事件需启动WarRoom攻关,进行拉会处理事件,事件可快速恢复。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件单详情 单击“启动WarRoom”。 图2
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
Warroom是什么? 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
故障信息 操作场景 WarRoom启动后,可以查看、编辑故障信息,本节介绍如何管理WarRoom的故障信息。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
(CCE)攻击场景 如果选择攻击目标来源为云数据库(RDS),则选择指定的云数据库实例,单击“下一步”。 图10 选择攻击目标为云数据库(RDS) 选择云数据库(RDS)攻击场景并填写场景的攻击参数,单击“完成”即可。 图11 云数据库(RDS)攻击场景 如果选择攻击目标来源为分
影响应用管理 操作场景 WarRoom启动后,可以添加新的受影响的应用,本节介绍如何新增WarRoom中的影响应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
通过等待API结果原子动作调用ECS的ShowServer接口,直到接口响应中的状态变为ACTIVE,即状态为运行中,才判定ECS实例已经启动成功。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面
进展通告 操作场景 WarRoom启动后,可以查看、更新、发送通告,本节介绍如何管理WarRoom的进展通告。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
与会成员 操作场景 WarRoom启动后,可以查看与会成员、邀请成员、设置恢复责任人、设置恢复成员、移除成员,本节介绍如何管理WarRoom中的与会成员。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
WarRoom状态 操作场景 WarRoom启动后,可以查看、更新WarRoom状态,本节介绍如何管理WarRoom的状态。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入
移动应用管理 移动应用管理用于管理事件启动Warroom时,创建企业微信Warroom作战室必要的企业微信配置信息,用户可通过移动应用管理页面管理企业微信的配置信息。 查看移动应用管理 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。当该租户已绑定企业微信时,
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对
在起会规则列表上方,单击“新建起会规则”,输入规则名称,选择区域,应用,事件级别,加入群组信息,完成后,单击“确定”。 起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,匹配起会规则的区域、应用、事件级别,会将加入群组的人加入到warroom会议和创建的移动应用中(移动
事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状
云运维中心中的故障管理、资源运维等场景中,支持发送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库 资源运维中,可以对云数据库进行批量操作。混沌演练中,支持对云数据库进行演练任务执行。 资源运维 混沌演练 裸金属服务器 资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。
单击“完成配置”,完成演练任务创建。 步骤四:启动演练 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。 单击“演练任务”页签,进入演练任务页面。 找到步骤三中创建的演练任务,单击操作列“启动演练”。 图7 启动演练 了解风险提示后,单击“确认”,进入演练记录详情页面。
填写转发信息 单击“升降级”。 图19 单击“升降级”按钮 填写升降级信息后,单击“提交”。 图20 填写升降级信息 单击“启动warroom”。 图21 单击“启动warroom”按钮 填写warroom信息后,单击“提交”。 图22 填写warroom信息 单击“事件处理”。 图23
授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot 授予重启云服务器的权限。 coc:instance:stop 授予关闭云服务器的权限。
资源运维中批量关闭云服务器 批量重启云服务器 ecs:cloudServers:reboot 资源运维中批量重启云服务器 批量启动云服务器 ecs:cloudServers:start 资源运维中批量启动云服务器 切换弹性云服务器操作系统 ecs:cloudServers:changeOS 资源运维中批量切换云服务器的操作系统