检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
P1:核心业务功能不可用,影响所有客户 P2:核心业务功能受损,影响部分客户,客户核心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:非系统业务异常,属于客户咨询、请求类问题 父主题: 事件管理
SLA管理 SLA(服务等级协议,Service Level Agreement),SLA管理为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户跟进和处理,并记录工单SLA触发详情。 自定义SLA 公共SLA SLA记录 父主题: 基础配置
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
定时运维 定时运维向客户提供了定时或周期性的向特定实例执行特定脚本或者作业的功能。 定时任务管理 定时任务执行记录 Cron表达式使用 父主题: 自动化运维
场景分类 故障属于哪种场景,包括冗余、容灾、过载、配置、依赖 发生条件 故障可能发生的条件 预计故障现象 故障发生时的业务现象 客户影响 故障造成的客户影响 选择是否有应急预案。如果选择是,请输入应急预案名称搜索,选择对应的应急预案,如果没有合适的应急预案 可以选择直接创建一个应
任务管理 执行记录 待办中心
变更管理 变更中心 变更配置
板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。
资源监控 提供用户查看CES监控信息的能力。 操作场景 通过Cloud Operations Center查看CES监控信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息 选择“存储监控”、“网络监控”、“站点监控”页签,查看不同监控信息。
总览 为用户提供资源健康度、资源监控信息、安全概览、运维能力、系统公告等相关信息,呈现基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
韧性中心 混沌演练 应急预案 PRR评审
WarRoom 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理
PRR评审 概述 PRR模板管理 PRR评审管理 父主题: 韧性中心
SLO管理 SLO(服务等级目标,Service Level Object),SLO管理目前对接Warroom、故障、告警等功能,自动化地完成SLO的计算,为SLO看板大屏提供数据。 查看SLO SLO指标配置 SLO中断记录 父主题: 基础配置
变更配置 变更配置概述 承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。 审批配置:支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 审批配置 父主题: 变更管理
参数中心 创建参数 修改参数 参数详情 父主题: 参数管理
变更中心 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 核心能力:当前支持变更管理、变更配置等能力。 创建变更单 审批变更单 实施及闭环变更单 父主题: 变更管理
流程管理 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照公司事件和问题管理流程制定级别的类别。 事件流程 问题流程 变更场景 父主题: 基础配置
ScheduleRole deleteRoleOncall 删除固定排班用户 ScheduleUser deleteGlobalFixed 全局固定排班添加用户 ScheduleUser createGlobalFixed 更新固定排班用户 ScheduleUser updatePersonnelsOncall