已找到以下 372 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 基本概念 - 云运维中心 COC

    由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码访问密钥)。 在我的凭证下,您可以查看账号IDIAM用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户密码等信息。 区域(Region) 从地理位置网络时延维度划分,同一个Region内共享弹性计算、块存储

  • 事件管理 - 云运维中心 COC

    事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理

  • 创建排班 - 云运维中心 COC

    若已有排班场景排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。 排班方式:排班的方式,可选择“固定班次”“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”“全局排班”。 场景描述:排班场景的详细说明。

  • 改进管理 - 云运维中心 COC

    任人,改进项完成后需验收人验收通过才能闭环。 前提条件 需要通过事件、Warrroom、混沌演练、PRR评审创建改进单。 处理改进单 登录运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。

  • 创建问题 - 云运维中心 COC

    需要先在应用管理中创建您的应用。 创建问题 登录运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 单击右上方“创建问题单”。 设置“创建问题单”。 表1 创建问题单参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述 对问题进行描述,具体描述问题现象对现网的影响。 上传附件 单击“添加文件”上传问题相关附件。

  • 演练报告 - 云运维中心 COC

    演练报告 操作场景 演练报告包含创建、编辑、改进事项以及故障记录的查看,以便用户全面地记录管理演练活动及其结果。 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表

  • 创建事件 - 云运维中心 COC

    创建事件 操作场景 运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。

  • 演练任务 - 云运维中心 COC

    若需要添加已有任务,单击“选择已有”,勾选已有任务,单击“确定”。 若需要添加新的攻击任务,请参考后续步骤。 表2 添加新的攻击任务参数说明 参数 说明 示例 厂商 请选择厂商类型。 华为 攻击目标来源 请选择目标实例的来源。 云容器引擎 (CCE)支持通过选择实例、指定pod、指定数量方式选择攻击目标。 弹性云服务器(ECS)

  • 集成管理 - 云运维中心 COC

    该步骤介绍自定义监控系统接入步骤 登录运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理页面中选择“Other Monitoring Systems 自定义集成”,单击“接入集成”。 页面展示详细的集成接入步骤。 填写集成系统的简称全称,单击“确认集成”。 集成自建监控系统告警。

  • 故障模式 - 云运维中心 COC

    故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分

  • 变更管理常见问题 - 云运维中心 COC

    变更管理常见问题 常规变更&紧急变更的区别? 变更级别的定义?

  • 验证问题 - 云运维中心 COC

    操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。

  • 转发事件 - 云运维中心 COC

    转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。

  • 起会规则 - 云运维中心 COC

    、应用、事件级别匹配到对应的规则,将规则中相关的人员拉入群组,关注故障恢复的人员在第一时间可以接收到故障,并响应故障。 新增起会规则 登录运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”。 单击右上方“创建起会规则”。 设置“创建起会规则”。 表1

  • 验证事件 - 云运维中心 COC

    事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。

  • 受理问题 - 云运维中心 COC

    受理问题 操作场景 问题单创建后,问题责任人分析问题实际情况,若属实则问题责任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完

  • 运维态势感知 - 云运维中心 COC

    比、趋势图Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别时间窗,反映重大故障场景的发生改善情况。回溯改进中包含回溯改进的闭环率趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率处理时间。指标详情可查看表3。

  • 批量BMS操作 - 云运维中心 COC

    批量BMS操作 批量开机 批量关机 批量重启 批量重装操作系统 父主题: 资源批量操作

  • 查看资源拓扑 - 云运维中心 COC

    源之间的相互关系,便于资源的使用、监控管理。 注意事项 支持查看华为资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录运维中心。 在左侧导航栏选择“资源管理 >

  • 概述 - 云运维中心 COC

    00个版本。 公共作业 公共作业是由运维中心提供几种常见运维场景的解决方案,作业详情所有用户可见,公共作业不支持用户的增加、修改删除。 自定义作业 自定义作业是由用户自定义创建并管理,作业包含自定义脚本、API、流程控制等,支持全局参数关联参数仓库。 单个租户账号下所有子账号最多支持创建200个作业。