检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件相关枚举信息 事件级别 事件类别 事件来源 事件状态 父主题: 事件管理
可选项“P1”、“P2”、“P3”、“P4”、“P5”。 严重程度默认“P1”最严重,“P5”最轻微。 业务是否中断 可选项“是”、“否”。 事件类别 在下拉列表选择事件的类别。 事件名称 根据命名规则,自定义事件的名称。 事件描述 对事件进行描述。 单击“确定”。 完成告警转事件。 父主题: 告警管理
事件流程 事件级别 事件类别 事件审批 故障复盘 父主题: 流程管理
修改故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。
自定义故障 操作场景 创建故障模式,可以针对潜在的故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器
PRR模板管理 操作场景 PRR模板管理支持用户创建、编辑、删除以及查看 PRR模板。 用户可以通过PRR模板管理进行模板的制定、评审等操作。 创建PRR模板 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,单击“PRR模板管理”,进入“PRR模板管理”页面。 图1
变更管控 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。 前提条件 开启变更管控需要申请IAM权限,具体的actionID如下: IAM v3版本权限: "iam:roles:listRoles", "iam:p
如表2所示,包括了COC的所有系统权限。基于角色授权场景的系统策略与基于策略授权场景的并不互通。 表2 COC系统权限 系统角色/策略名称 描述 类别 依赖关系 COC ReadOnlyAccess 云运维中心服务只读权限 系统策略 无 COC FullAccess 云运维中心服务管理员权限
问题定位出方案 操作场景 问题单受理后,需要对该问题进行定位分析,并给出定位结果和解决方案,便于后续回溯。 定位出方案 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案”。
概述 在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
如何使用人员管理 操作场景 人员管理统计了当前华为云账号下的用户和基础信息,通过人员管理功能您可以对用户信息进行编辑,比如修改联系方式和设置通知方式等,具体操作如下。 添加用户 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员
什么是云运维中心 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。