检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级
演练任务 操作场景 演练任务功能允许用户通过模拟软件或硬件故障来测试系统的恢复能力。演练任务操作包括管理混沌演练任务和查看演练记录,以及创建演练任务的流程。演练任务的设置包括基础信息、攻击任务组的添加、攻击任务的选择、攻击场景的选择等。此外,演练任务还涉及监控任务配置,以及演练后的复盘改进
集成管理 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
验证问题 操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”
起会规则 操作场景 起会规则是在启动WarRoom时,根据区域、应用、事件级别匹配到对应的规则,将规则中相关的人员拉入群组,关注故障恢复的人员在第一时间可以接收到故障,并响应故障。 新增起会规则 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,
受理问题 操作场景 问题单创建后,问题责任人分析问题实际情况,若属实则问题责任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完成问题单受理
运维态势感知 前提条件 如果您是在单账号场景下使用运维态势感知,您可跳过此部分内容,查看操作步骤。 如果您是在跨账号场景下使用运维态势感知,需要满足以下前提条件: 1、当前账号已经开启跨账号管理,并且是组织/委托管理员账号。 2、组织成员账号已开通云运维中心COC服务。 操作场景
删除自定义脚本 功能介绍 删除作业脚本:自定义脚本。 URI DELETE /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本uuid 最小长度:1 最大长度:25 请求参数 无
查询脚本列表 功能介绍 作业脚本列表:自定义脚本 limit最大为100 URI GET /v1/job/scripts 表1 Query参数 参数 是否必选 参数类型 描述 limit 是 Integer 分页参数:每页返回记录个数限制 最小值:1 最大值:100 marker
展示批次列表 功能介绍 查询:批次列表 返回:批次index、批次标签 URI GET /v1/job/script/orders/{execute_uuid}/batches 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行
重新开启事件 操作场景 事件单被驳回后,事件提单人再次确认该故障需要提交,可以编辑事件单内容后重新提交。 重新开启事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“重新开启”。 设置“修改事件单
账号基线 操作场景 账号基线分为全局基线和组件基线。 全局基线:系统内置基线,针对没有绑定组件的主机,不可删除,使用全局基线需要通过修改账号基线添加基线账号;开启了全局基线的改密策略后,会按照基线中创建的账号来进行定期改密。 组件基线:创建账号基线创建的是组件基线,用户根据业务需求自定义创建
补丁扫描 操作场景 您可以通过补丁扫描功能扫描目标实例补丁的合规性,补丁扫描会根据您选择的默认基线、实例、分批执行策略进行扫描。扫描后的扫描结果展示实例补丁的合规状态。 注意事项 若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常。 是否为Cloud Operations
问题待现网实施 操作场景 问题单定位方案如果判断需要进行现网变更,问题单会走到待现网实施阶段。此时需要在问题区域实施变更,变更完成后问题单才算解决。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 现网实施 登录云运维中心。 在左侧导航栏选择
审批配置 操作场景 审批配置是在创建、修改脚本时,可以强制指定排班或个人用户作为审核人,并通过短信、钉钉等方式通知审核人,审核人需要对创建或修改的脚本进行审批才可以完成创建或修改流程。 注意事项 若要通过排班配置审核人,则需要提前在排班管理中创建排班。 当审批配置开启了入库人工审核时
概述 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100
事件历史记录 操作场景 若需追溯事件处理阶段中某个节点做了什么操作,可以查看事件的历史记录,事件历史记录包含事件的整个处理过程。 事件历史记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击上方“全部事件单”。 选择需要查看的事件单,单击事件标题。 单击上方“