检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告,在故障报告基础上对本次故障进行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和启动了
转发问题 操作场景 问题单处理过程发现该问题属于其他运维专家处理,可转发问题单给对应的责任人。 转发问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“转发责任人”。 设置“转发责任人”。 表
查看SLO 操作场景 用户可以通过此页面查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 查看SLO 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值
启动WarRoom 操作场景 事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题
SLO中断记录 操作场景 用户可以通过此页面查看、添加和修正SLO中断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3
PRR模板管理 操作场景 PRR模板管理支持用户创建、编辑、删除以及查看 PRR模板。 用户可以通过PRR模板管理进行模板的制定、评审等操作。 创建PRR模板 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,单击“PRR模板管理”,进入“PRR模板管理”页面。 图1
开始评估 操作场景 当您需要对应用韧性评估任务进行评估时,请按如下操作进行。 若评估状态为“未评估”,详细操作请参考开始评估。 若评估状态为其他状态,详细操作请参考重新评估。 注意事项 一个应用当前支持最多评估30次,若评估达到上限,再次”重新评估”时,会提示自动删除最老的评估报告
删除应用 操作场景 应用创建后,若想删除应用或子应用,请按如下操作进行。 注意事项 当应用或子应用下存在分组、组件或子应用时,此应用或子应用无法删除。必须保证节点下为空才可以删除。 删除应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”
评估报告 操作场景 应用韧性评估任务完成后,若想查看评估结果详情,请按如下操作进行。 注意事项 应用的评估状态为“评估完成”时才可以查看评估报告。 查看评估报告 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“查看报告”。 查看最新的评估报告详情。
创建流转规则 操作场景 用户通过流转规则可以实现事件、告警等规则的自定义配置。通过配置流转规则,将原始告警转成汇聚告警或事件。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。
修改分组 操作场景 分组创建后,若想对分组的参数进行修改,请按如下操作进行。 修改分组 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择分组,单击。 设置“编辑分组”。 表1 修改分组参数说明 参数 说明 示例
问题处理记录 操作场景 问题回溯过程对处理问题或者填写问题单相关信息有疑问,可以查询处理记录。 处理记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要查看的问题单,单击问题单标题。 单击“处理记录”。 查看问题处理历史记录。 父主题:
管理流转规则 操作场景 流转规则创建后,若需要禁用、启用、修改、复制或删除流转规则,请按如下操作进行。 禁用规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要禁用的规则,单击操作列“禁用”。 单击“确定”。 完成流转规则禁用。 启用规则 登录云运维中心。
Warroom是什么? 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单击搜索框
SLA记录 操作场景 若客户账号下有启用状态的SLA规则,且有对应的工单触发SLA规则,则会在SLA记录页面生成一条记录,用户可以在此页面查看SLA记录详情,例如工单ID,SLA状态,SLA规则(公共SLA或者用户创建的自定义SLA)等。 查看SLA记录 登录COC。 在左侧菜单栏选择
审批变更单 操作场景 变更单创建后,需审批变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,审批变更单。 图1 审批变更单 父主题: 变更中心
补丁基线 操作场景 补丁基线支持用户自定义配置。用户可通过所设置的补丁基线对实例的补丁进行扫描,修复不符合基线的补丁。 补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器
改密策略 操作场景 根据业务需要,您可以通过云运维中心进行策略设置,确保您新增的主机实例也能被定期改密。 改密策略分为全局基线和组件基线。 全局基线改密策略:开启全局维度的改密策略后,所有未绑定组件的增量主机实例将会被定期改密。 组件基线改密策略:开启组件维度的改密策略后,所有被选中的组件下的增量主机实例将会被定期改密
变更级别的定义? 变更级别是对变更风险可量化的定义,变更A级风险最高,其次是变更B级、变更C级、变更D级。 父主题: 变更管理常见问题