检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom状态 操作场景 WarRoom启动后,可以查看、更新WarRoom状态,本节介绍如何管理WarRoom的状态。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入
除以上的参数,其他参数均放在该参数中,使用additional.xxx表示,CES相关字段描述点击这里查看 除以上的参数,其他参数均放在该参数中,使用additional.xxx表示,AOM相关字段描述点击这里查看 在响应预案部分,选择针对本次流转规则相关联的脚本、作业和应急预案,脚本和作业的添加请参考自动化运维。
增删改及执行定时运维任务 x √ 查看参数中心 √ √ 增删改参数 x √ 查看事件单 √ √ 创建及处理事件 x √ 查看告警记录 √ √ 处理告警 x √ 查看混沌演练规划 √ √ 执行演练任务 x √ 查看排班 √ √ 创建排班 x √ 查看帐号基线 √ √ 创建帐号基线 x √ 策略授权系统权限
在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入“演练记录”列表。在演练记录列表“操作”列,单击“创建报告”或单击“进度查看”,进入“演练记录详情”页,在右侧单击“创建演练报告”。
资源管理 同步资源 执行UniAgent操作 查看资源详情 查看资源拓扑 父主题: 应用资源管理
补丁修复后合规性报告仍然为不合规如何处理? 单击修复后生成的合规性报告摘要 图1 合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启 补丁已安装
请选择需要执行作业的目标实例。 分批策略 不分批 目标实例的分批执行策略。 单击“提交”,进入确认执行页面。 确认作业配置,单击“确定”,进入工单详情页面。 刷新页面,查看作业执行情况。
授权方式选择“直接给用户授权(适用于企业项目授权)”,根据需要分配“COC FullAccess”或“COC ReadOnlyAccess”策略,策略详情可查看COC权限管理。 图3 分配COC策略 如已有包含云运维中心策略的群组,可选择"继承所选用户组的策略"方式授权,可参考IAM用户授权。 选择授权范围方案,指定企业项目资源。
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。 查看安全概览 云监控 总览页面中支持资源监控总览,以及资源告警详情的查看。故障管理中,支持接入云监控服务产生的告警,并在云运维
登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 图1 历史告警列表 在集成告警列表“操作”列选择 “更多 > 历史记录” 可查看当前告警单历史记录。 图2 告警单历史记录 父主题: 汇聚告警
原始告警 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
条件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。 图2 可信服务 当前执行跨账号运维操作的账号是组织管理员或者是组织管理员所委派的委托管理员。 图3
确认”。 图1 事件单创建改进单 图2 创建改进单 改进信息提交后可以下事件详情页面,改进记录中查看改进单状态及当前责任人,同时点击改进名称会跳转至改进管理页面处理改进单。 图3 查看改进记录 父主题: 处理事件
WarRoom启动后,可以添加新的受影响的应用,本节介绍如何新增WarRoom中的影响应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在“故障影响”模块,单击“新
单击右侧“修正”,右边弹出添加中断记录弹框,修改中断的不可用时间。 图3 修正中断记录 单击右侧“修正记录”,右边弹出添加中断记录弹框,查看修正的历史记录。 图4 查看中断修正记录 父主题: SLO管理
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
通知管理 通知管理为用户创建通知规则,通知规则包含事件通知、变更通知和问题通知。 当产生事件单、问题单或有变更单时,通知规则会根据事件/问题/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。