检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 图1 历史告警列表 在集成告警列表“操作”列选择 “更多 > 历史记录” 可查看当前告警单历史记录。 图2 告警单历史记录 父主题: 汇聚告警
创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作 查看资源详情 查看容量排名 父主题: 应用资源管理
单击 “添加自检材料”,进行自检材料上传。 填写完成后单击“确认”。 图4 发起PRR评审完成 查看PRR评审详情 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,查看PRR评审列表。 图5 PRR评审列表 在“PRR评审名称”列,单击 对应的“PRR评审名称”,即可进入“PRR评审详情”页面。
资源管理 同步资源 执行UniAgent操作 查看资源详情 查看资源拓扑 父主题: 应用资源管理
原始告警 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
条件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。 图2 可信服务 当前执行跨账号运维操作的账号是组织管理员或者是组织管理员所委派的委托管理员。 图3
定时任务执行记录 查看定时任务执行记录 登录COC。 在左侧菜单栏选择“资源运维 > 自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 在“定时运维”页面,单击列表数据操作列的“更多 > 历史记录”,跳转定时任务“历史记录”页面。 图1 查看执行情况 单击工
演练操作动作,系统后台在演练不同阶段会自动设置对应的值。可以选择: inject_fault:表示演练处于故障注入阶段 check_fault_status:表示演练处于故障查询阶段 rollback:表示演练处于取消正在注入故障的阶段 clean:表示演练处于清理环境阶段 CAN_ROLLBACK false 是否支持回滚;可以选择:
单击右侧“修正”,右边弹出添加中断记录弹框,修改中断的不可用时间。 图3 修正中断记录 单击右侧“修正记录”,右边弹出添加中断记录弹框,查看修正的历史记录。 图4 查看中断修正记录 父主题: SLO管理
步骤描述,单击“保存”,完成创建应急预案。 图8 文档预案步骤 查看应急预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 单击“应急预案”,查看应急预案。 图9 查看应急预案 编辑应急预案 登录COC。 在左侧菜单栏选择“韧性中心 >
WarRoom启动后,可以添加新的受影响的应用,本节介绍如何新增WarRoom中的影响应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在“故障影响”模块,单击“新
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
强制重启会导致云服务器中未保存的数据丢失,请谨慎操作。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程