检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
策略授权的示例 暂不涉及。 父主题: 开通云运维中心并授权使用
安全概览 提供用户查看安全云脑的安全监控信息的能力。 操作场景 通过Cloud Operations Center查看安全云脑的安全监控信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看安全云脑的安全监控信息。 图1 安全云脑监控信息 单击“自定义看板”,设置可显示的图表。
运维事务中心 提供用户查询、跟踪运维待办事项的能力。 操作场景 通过Cloud Operations Center查询、跟踪运维待办事项。 操作步骤 登录COC。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量。 图1 运维事务跟踪 单击“待处理
应用监控 提供用户自定义添加应用,查看应用监控信息的能力。 操作场景 通过Cloud Operations Center查看应用运维管理中仪表盘信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看应用监控信息。 单击“ 自定义看板”设置需要监控的应用。 图1 应用监控信息
应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 应急预案页面 单击“创建应急预案”,填写应急预案基本信息。
资源监控 提供用户查看CES监控信息的能力。 操作场景 通过Cloud Operations Center查看CES监控信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息 选择“存储监控”、“网络监控”、“站点监控”页签,查看不同监控信息。
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
选择“分批策略”和“熔断策略”。 可根据业务选择是否勾选入库人工审核。 图20 编辑人工审核 根据业务选择是否开启消息通知,开启时,勾选通知策略,选中通知对象和通知渠道。 图21 编辑通知 单击“提交”,即可成功创建定时任务。 执行的作业和脚本可在本服务左侧菜单“自动化运维”>“作业管理”和“脚本管理”模块中进行设置。
运维态势感知 云运维中心提供运维态势感知的能力,包含变更、事件、告警、安全合规、SLO(服务级别目标)、PRR(生产准备度评估)等多种运维指标数据,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 预置接
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
故障信息 操作场景 WarRoom启动后,可以查看、编辑故障信息,本节介绍如何管理WarRoom的故障信息。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
WarRoom状态 操作场景 WarRoom启动后,可以查看、更新WarRoom状态,本节介绍如何管理WarRoom的状态。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
改进管理 前提条件 需要通过事件/Warrroom/演练/PRR创建改进单。 处理改进单 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,单击改进标题进入“改进单详情”页面。 图1 改进列表 单击右上角的“处理”或“转发” ,进入处理或转发页面 图2
问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。
创建问题 操作场景 通过Cloud Operations Center创建一个问题单。 前提条件 需要先在应用管理中创建您的应用。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入问题列表页面。单击右上角的“创建问题”,进入创建问题页面。 图1 问题列表 填写创建问题基本信息,点击“提交”。
审批配置 审批配置概述 支持用户根据自身业务诉求,从变更类型、变更级别两个维度配置审批流程&审批人 创建审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,单击“创建审批配置”,进入“创建审批配置”页面。 图1 创建审批配置 填写审批配置内容,单击“提交”。 图2
与会成员 操作场景 WarRoom启动后,可以查看与会成员、邀请成员、设置恢复责任人、设置恢复成员、移除成员,本节介绍如何管理WarRoom中的与会成员。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1
批量重启 操作场景 通过Cloud Operations Center ECS操作批量重启功能进行ECS实例批量重启。 注意事项 已关机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单击“批量重启”,进入“批量重启”页面。