启动WarRoom 操作场景 事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。
命令类型 支持发送的脚本命令类型。 Windows系统ECS:支持Bat。 Linux系统ECS:支持Shell(默认)、Python。 命令输入 待发送命令的输入框。 输入内容必须为单次执行可返回结果的命令,即不支持与命令返回信息进行二次交互。
1.请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1.1.0以下重试。
图2 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。 图3 “手动安装UniAgent”页面 UniAgent安装完成后,单击 “返回自动安装”。 单击“设置安装机”,设置刚才完成UniAgent安装的机器为安装机。
校验高危命令:可对脚本内容进行高危检测。 校验范围:检测涉及的高危命令范围,可点击“高危命令说明”查看校验的规则列表。 校验规则:在校验范围内,通过正则匹配方式对脚本内容进行高危命令匹配。 校验结果:通过正则校验结果返回脚本内容是否高危,即:低风险、高风险。
进入黑屏命令页面。 父主题: 账号管理
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
自定义脚本 执行命令 可以用来执行特定的命令。支持“Shell”、“Python”、“Bat”三种命令类型,支持自定义命令内容和命令入参。 自定义脚本执行 可以选择已创建的自定义脚本,创建自定义脚本详细操作参考创建自定义脚本。 设置“输入”、“输出”参数,设置“异常处理”选项。
WarRoom状态 操作场景 WarRoom启动后,在处理故障过程中需查看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。
已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
暂不支持裸金属服务器(BMS)、Flexus应用服务器L实例(HCSS)、云搜索服务(CSS)。 监控详情模块展示攻击目标的实时监控数据,需要预先在创建攻击任务时配置演练监控任务。 查看演练记录 查看演练任务的演练记录。如果当前演练任务没有被演练过,则不能查看演练记录。
在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右上方“修改”。 设置“修改故障信息”。
新增影响应用 WarRoom在启动、故障定界和恢复阶段支持新增影响应用功能。 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击“新增影响应用”。 设置“新增影响应用”。
默认规则: 启动Warroom的事件单,P1, P2, P3, P4, P5均需复盘; 未启动Warroom的事件单,P1, P2, P3, P4需进行复盘。 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。
多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码,在安全管控下支持无需输入密码可登录linux主机执行命令。账号密码管理、自动改密和免密登录操作如下。 账号密码管理场景步骤: 导入账号、查看账号密码。
不支持故障紧急终止 云搜索服务 (CSS) 实例类 CSS集群重启 重启状态可用的CSS集群。重启期间,kibana和cerebro可能会访问失败。不支持故障紧急终止 文档数据库服务 (DDS) 实例类 备节点强制升主 支持副本集、shard和config备节点强制升主。
支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器(ECS) √ √ √ √ √ √ 云数据库(RDS) √ √ √ × × × Flexus应用服务器L实例(FlexusL) √ √ √ √
自定义脚本 自定义脚本是由用户自定义创建并管理,脚本支持“Shell”、“Python”、“Bat”三种命令,支持全局参数和关联参数仓库。 脚本内容大小限制1M。 单个租户账号下所有子账号最多支持创建200个脚本。
全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。
选择排班角色,其中的排班人员在启动WarRoom时会被自动加入到第三方移动应用群组。 配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。
您即将访问非华为云网站,请注意账号财产安全