检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
脚本工单 提供用户查看、操作脚本工单的能力。 前提条件 用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过Cloud Operations Center查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
P1:核心业务功能不可用,影响所有客户 P2:核心业务功能受损,影响部分客户,客户核心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:非系统业务异常,属于客户咨询、请求类问题 父主题: 事件管理
补丁工单 提供用户查看、操作补丁工单的能力。 前提条件 用户使用补丁管理,系统生成对应的工单。 操作场景 通过Cloud Operations Center查看补丁工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“补丁工单”页签。 用户可以通过ID
SLA管理 SLA(服务等级协议,Service Level Agreement),SLA管理为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户跟进和处理,并记录工单SLA触发详情。 自定义SLA 公共SLA SLA记录 父主题: 基础配置
作业工单 提供用户查看、操作作业工单的能力。 前提条件 用户下发了执行作业的任务,系统生成对应的作业工单。 操作场景 通过Cloud Operations Center查看作业工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“作业工单”页签。可对作业工单进行“克隆操作”和“
资源操作工单 提供用户查看资源操作工单的能力。 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 通过Cloud Operations Center查看ECS工单、RDS工单、BMS工单、FlexusL工单。 操作步骤 登录COC。
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
果选择“是”,必须填写“故障发生时间”及“故障恢复时间”。此处填写的业务中断时间计入对应应用的SLO中断记录。 图1 清除告警-业务中断 生成SLO中断记录需要先设置对应的SLA规则、SLO规则,并且该告警存在对应的SLA记录。 输入备注,单击“确定”,清除告警。 备注可以包含中
审批配置 审批配置概述 支持用户根据自身业务诉求,从变更类型、变更级别两个维度配置审批流程&审批人 创建审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,单击“创建审批配置”,进入“创建审批配置”页面。 图1 创建审批配置 填写审批配置内容,单击“提交”。 图2
场景分类 故障属于哪种场景,包括冗余、容灾、过载、配置、依赖 发生条件 故障可能发生的条件 预计故障现象 故障发生时的业务现象 客户影响 故障造成的客户影响 选择是否有应急预案。如果选择是,请输入应急预案名称搜索,选择对应的应急预案,如果没有合适的应急预案 可以选择直接创建一个应
图16 选择已有攻击任务 单击“完成配置”,即可完成演练任务的创建。 图17 完成配置 编辑演练任务 编辑已经创建的演练任务,演练任务已生成演练记录,不可操作编辑。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 在演练任务列表的“操作”列,选择“更多
板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。
定时运维 定时运维向客户提供了定时或周期性的向特定实例执行特定脚本或者作业的功能。 定时任务管理 定时任务执行记录 Cron表达式使用 父主题: 自动化运维
周日)”。 固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。 轮班(周一 -- 周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排
总览 提供用户创建运维事务,查看用户的资源健康、资源监控、安全、运维能力、系统公告等相关信息,为用户提供基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
韧性中心 混沌演练 应急预案 PRR评审
2、变更级别:A级>B级>C级>D级 3、变更场景:支持用户根据业务情况自定义配置 4、变更应用:先选择顶层应用,再选择下层具体的应用范围 5、变更区域:变更区域和变更应用相结合定义变更范围 6、变更计划:以region为维度生成 需要按region配置实施人&配合人; 需要按reg
任务管理 执行记录 待办中心