已找到以下 50 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 应急预案 - 云运维中心 COC

    应急预案 概述 自定义预案 公共预案 父主题: 韧性中心

  • 全旅程混沌工程方案 - 云运维中心 COC

    在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签,单击“创建应急预案”。 图4 应急预案页面 填写应急预案基本信息。 图5 创建应急预案 表2 应急预案参数说明 参数名 参数说明 应急预案名称 用户自定义此次演练的应急预案名 所属应用 演练目标主机或容器的所属应用 应急预案概述 描述应急预案主要信息

  • 公共预案 - 云运维中心 COC

    您可以对公共预案进行克隆,从而创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 查看公共预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“公共预案”页签。 单击公共预案表格第一列“应急预案”名称,查看应急预案。 图1 查看应急预案 克隆公共预案 登录COC。

  • 自定义预案 - 云运维中心 COC

    您可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 自定义预案页面 单击右上角“创建应急预案”,填写应急预案基本信息。 图2 创建应急预案 表1 应急预案基本信息参数说明

  • 提交事件单解决方案 - 云运维中心 COC

    提交事件单解决方案 功能介绍 HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num

  • 问题定位出方案 - 云运维中心 COC

    问题定位出方案 操作场景 问题单受理后,需要对该问题进行定位分析,并给出定位结果和解决方案,便于后续回溯。 定位出方案 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案”。

  • 什么是云运维中心 - 云运维中心 COC

    全方位变更管理 方案评审:支持变更方案标准化(Standard Operating Procedure,简称SOP),将变更方案明确并电子化,经评审后归档。支持规则和流程解耦,保证变更执行过程不走样,同时将变更方案沉淀。 变更审批:按照预设审批流程审批变更单,保障变更方案可靠性、时间合理性、流程合规性。

  • 问题待现网实施 - 云运维中心 COC

    问题待现网实施 操作场景 问题单定位方案如果判断需要进行现网变更,问题单会走到待现网实施阶段。此时需要在问题区域实施变更,变更完成后问题单才算解决。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 现网实施 登录云运维中心。 在左侧导航栏选择“故障管理

  • 处理事件 - 云运维中心 COC

    在“待处理的”页签,选择需要处理的事件单,单击事件标题。 根据执行的响应预案。 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行响应预案”。 执行步骤5。 若没有合适的应急预案需要创建,单击“创建应急预案”,详细步骤请参考创建应急预案。 若选择脚本,在下拉列表选择相应的脚本,单击“执行响应预案”。

  • 影响应用管理 - 云运维中心 COC

    单击需要修改的WarRoom标题。 选择需要处理的应用,单击“执行预案”。 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行”。 若没有合适的应急预案需要创建,请参考创建应急预案。 根据应急预案关联的任务类型。 若任务类型为脚本,执行步骤7。 若任务类型为作业,执行步骤8。

  • 服务韧性 - 云运维中心 COC

    COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。

  • 受理事件单 - 云运维中心 COC

    受理事件单 功能介绍 受理事件 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号,示

  • 概述 - 云运维中心 COC

    概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)

  • 标准化故障管理 - 云运维中心 COC

    事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通

  • 实施及闭环变更单 - 云运维中心 COC

    变更单审批后,按照变更方案在规定时间窗内实施变更,实施完成后需回填变更结果,并填写验证报告。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,点“变更开始”。若变更方案关联的作业,需先

  • 故障模式 - 云运维中心 COC

    来源 包括主动分析,已有故障。 是否有应急预案 是或者否,默认为是。 告警ID 故障发生时曾触发过的告警ID。 攻击场景 提供所有攻击场景进行选择,限十个。 应急预案名称 下拉搜索选择对应的应急预案,如果没有,可以创建应急预案,具体参考应急预案章节。 场景分类 故障属于哪种场景,包括冗余、容灾、过载、配置、依赖。

  • 应用场景 - 云运维中心 COC

    恢复,未知故障沉淀经验。 图4 标准化故障管理 智能化混沌演练 全旅程混沌工程解决方案,快速评估应用潜在韧性风险,持续看护应用架构。 端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。 故障模式库:首创基于容错

  • 创建变更单 - 云运维中心 COC

    创建变更单 操作场景 应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤

  • 验证事件处理结果 - 云运维中心 COC

    验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号

  • 概述 - 云运维中心 COC

    网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一