检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组,
故障模式库:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,用户开箱即用。 图5 智能化混沌演练
日志 用户开通云审计服务并创建和配置追踪器后,CTS可记录与云运维中心服务相关的操作事件。 详细的操作列表以及查看方法,请参见查看审计日志。 父主题: 安全
诊断工具 OS诊断 父主题: 故障管理
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
脚本管理 概述 审批配置 创建自定义脚本 管理自定义脚本 执行自定义脚本 执行公共脚本 父主题: 自动化运维
排班场景管理 使用场景 排班创建后,排班场景和排班角色有变化,可在排场场景管理中增删改查。 创建排班场景操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击“场景管理”,进入“场景管理”页面。 图1 场景管理 单击“创建排班场景”,创建排班场景。 图2 排班场景列表
PRR评审管理 操作场景 用户可以通过PRR评审来管理产品从立项到上线的过程,PRR评审基于PRR模板。PRR评审管理列表展示所有 PRR评审的基本信息,评审详情可以查看评审进程详情以及改进事项等。 发起PRR评审 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,查看
创建变更单 操作场景 应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤
通过云运维中心的资源管理功能可以将华为云、友商云核心资源和IDC离线资源统一管理,为变更管理、批量运维等功能提供准确、及时、一致的资源配置数据。 父主题: 资源管理
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。
删除分组 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择分组,单击。 单击“确定”。 完成分组删除。 父主题: 应用管理
登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击“新增影响应用”。 设置“新增影响应用”。 表1 新增影响应用参数说明 参数 说明 影响应用 在下拉列表选择受影响应用。 开始时间 请填写应用开始受影响的时间。
创建评估任务 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击“创建应用韧性评估”。 在下拉列表选择需要评估的应用,单击“确定”。 完成应用韧性评估任务创建。 删除评估任务 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。
修改子应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要修改的子应用,单击。 设置“编辑子应用”。 表2 编辑应用参数说明 参数 说明 示例 子应用名称 根据命名规则,自定义子应用的名称。
查看SLO 操作场景 用户可以通过此页面查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 查看SLO 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值
参数中心 概述 创建参数 修改参数 参数详情 父主题: 自动化运维
SLA管理概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响
受理事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“受理”。 完成事件受理,事件状态变更为“已受理”。 父主题: 事件管理