已找到以下 372 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 概述 - 云运维中心 COC

    rRoom。 故障定界恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果应用状态。 注意:将所有

  • 应用场景 - 云运维中心 COC

    理流畅度运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截自动化稽查

  • 审计与日志 - 云运维中心 COC

    案中专业的日志审计服务,提供对各种资源操作记录的收集、存储查询功能,可用于支撑安全分析、合规审计、资源跟踪问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍开通配置方法,请参见CTS快速入门。

  • 诊断工具 - 云运维中心 COC

    诊断工具 OS诊断 父主题: 故障管理

  • 混沌演练 - 云运维中心 COC

    混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心

  • 创建脚本 - 云运维中心 COC

    创建脚本 功能介绍 创建作业脚本:自定义脚本 脚本有标签属性,表示是高危脚本。创建时候不需要对脚本进行是否是高危的二次校验。 进行租户隔离;北向接口创建的脚本,审批人字段不填写,默认不需要审批 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。

  • 约束与限制 - 云运维中心 COC

    约束与限制 更详细的限制请参见具体API的说明。 父主题: 使用前必读

  • 事件管理 - 云运维中心 COC

    事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理

  • 创建排班 - 云运维中心 COC

    若已有排班场景排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。 排班方式:排班的方式,可选择“固定班次”“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”“全局排班”。 场景描述:排班场景的详细说明。

  • 改进管理 - 云运维中心 COC

    任人,改进项完成后需验收人验收通过才能闭环。 前提条件 需要通过事件、Warrroom、混沌演练、PRR评审创建改进单。 处理改进单 登录运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。

  • 创建问题 - 云运维中心 COC

    需要先在应用管理中创建您的应用。 创建问题 登录运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 单击右上方“创建问题单”。 设置“创建问题单”。 表1 创建问题单参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述 对问题进行描述,具体描述问题现象对现网的影响。 上传附件 单击“添加文件”上传问题相关附件。

  • 演练报告 - 云运维中心 COC

    演练报告 操作场景 演练报告包含创建、编辑、改进事项以及故障记录的查看,以便用户全面地记录管理演练活动及其结果。 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表

  • 创建事件 - 云运维中心 COC

    创建事件 操作场景 运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。

  • 演练任务 - 云运维中心 COC

    若需要添加已有任务,单击“选择已有”,勾选已有任务,单击“确定”。 若需要添加新的攻击任务,请参考后续步骤。 表2 添加新的攻击任务参数说明 参数 说明 示例 厂商 请选择厂商类型。 华为 攻击目标来源 请选择目标实例的来源。 云容器引擎 (CCE)支持通过选择实例、指定pod、指定数量方式选择攻击目标。 弹性云服务器(ECS)

  • 集成管理 - 云运维中心 COC

    该步骤介绍自定义监控系统接入步骤 登录运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理页面中选择“Other Monitoring Systems 自定义集成”,单击“接入集成”。 页面展示详细的集成接入步骤。 填写集成系统的简称全称,单击“确认集成”。 集成自建监控系统告警。

  • 故障模式 - 云运维中心 COC

    故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分

  • 验证问题 - 云运维中心 COC

    操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。

  • 转发事件 - 云运维中心 COC

    转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。

  • 起会规则 - 云运维中心 COC

    、应用、事件级别匹配到对应的规则,将规则中相关的人员拉入群组,关注故障恢复的人员在第一时间可以接收到故障,并响应故障。 新增起会规则 登录运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”。 单击右上方“创建起会规则”。 设置“创建起会规则”。 表1

  • 验证事件 - 云运维中心 COC

    事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。