检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
演练报告 操作场景 演练报告包含创建、编辑、改进事项以及故障记录的查看,以便用户全面地记录和管理演练活动及其结果。 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
运维态势感知 前提条件 如果您是在单账号场景下使用运维态势感知,您可跳过此部分内容,查看操作步骤。 如果您是在跨账号场景下使用运维态势感知,需要满足以下前提条件: 1、当前账号已经开启跨账号管理,并且是组织/委托管理员账号。 2、组织成员账号已开通云运维中心COC服务。 操作场景
验证问题 操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”
起会规则 操作场景 起会规则是在启动WarRoom时,根据区域、应用、事件级别匹配到对应的规则,将规则中相关的人员拉入群组,关注故障恢复的人员在第一时间可以接收到故障,并响应故障。 新增起会规则 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,
受理问题 操作场景 问题单创建后,问题责任人分析问题实际情况,若属实则问题责任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完成问题单受理
安全评分 操作场景 通过云运维中心查看安全云脑 SecMaster的安全评分和风险,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑
概述 变更管理主要为构建运维作业全生命周期的安全生产能力,降低变更风险,主要承载变更流程管理业务。包含变更日历、变更中心、变更配置、变更管控等能力。 变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理业务
排班场景管理 使用场景 排班创建后,排班场景和排班角色有变化,可在排场场景管理中增删改查。 创建排班场景操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击“场景管理”,进入“场景管理”页面。 图1 场景管理 单击“创建排班场景”,创建排班场景。 图2 排班场景列表
PRR评审管理 操作场景 用户可以通过PRR评审来管理产品从立项到上线的过程,PRR评审基于PRR模板。PRR评审管理列表展示所有 PRR评审的基本信息,评审详情可以查看评审进程详情以及改进事项等。 发起PRR评审 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,查看
创建变更单 操作场景 应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤
删除分组 操作场景 分组创建后,若想删除分组,请按如下操作进行。 删除分组 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择分组,单击。 单击“确定”。 完成分组删除。 父主题: 应用管理
执行用户:默认“root”,目标实例节点上执行脚本的用户。 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。 目标实例:单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。
配置任务 操作场景 应用韧性评估以应用为粒度的资源进行韧性评估,本节操作介绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上限时
修改应用 操作场景 应用创建后,若想对应用的名称或描述进行修改,请按如下操作进行。 修改应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要修改的应用,单击。 设置“编辑应用”。 表1 编辑应用参数说明 参数 说明
查看SLO 操作场景 用户可以通过此页面查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 查看SLO 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值