检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
P1:核心业务功能不可用,影响所有客户 P2:核心业务功能受损,影响部分客户,客户核心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:非系统业务异常,属于客户咨询、请求类问题 父主题: 事件管理
变更管理 变更中心 变更配置 变更管控
资源批量操作 概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
韧性中心 混沌演练 应急预案 PRR评审 应用韧性评估
人员管理 人员管理概述 如何使用人员管理 父主题: 基础配置
场景分类 故障属于哪种场景,包括冗余、容灾、过载、配置、依赖。 发生条件 故障可能发生的条件。 预计故障现象 故障发生时的业务现象。 客户影响 故障造成的客户影响。 选择是否有应急预案。如果选择是,请输入应急预案名称搜索,选择对应的应急预案,如果没有合适的应急预案 可以选择直接创建一个
总览 为用户提供资源健康度、资源监控信息、安全概览、运维态势感知、系统公告等相关信息,呈现基于资源一站式的信息概览,同时您可通过总览页面右上角“自定义设置”灵活配置页面楼层的展示和排序。 运维概览 快速配置中心 资源看板 资源监控 优化顾问 安全评分 运维态势感知
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
300+的评估项,覆盖节点、集群、网络、容灾、容器、业务和数据等六种维度,针对以应用为粒度的资源进行韧性评估,帮助客户提前识别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。 应用韧性主要包含如下功能点: 评估/重新评估:能够自动对应用内支持的资源进行扫描
定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。 执行对象:目标实例,由客户自行选择。 定时运维使用限制 单个租户最多支持创建100个定时任务。 目标实例目前仅支持弹性云服务器(ECS)和裸金属服务器(BMS)两种类型。
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。
资源管理 资源管理 应用管理
资源看板 操作场景 您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源
1、当前coc生成的变更管控策略默认仅提供绑定在用户组的功能,请勿将策略用作其他用途; 2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
SLA记录 操作场景 若客户账号下有启用状态的SLA规则,且有对应的工单触发SLA规则,则会在SLA记录页面生成一条记录,用户可以在此页面查看SLA记录详情,例如工单ID,SLA状态,SLA规则(公共SLA或者用户创建的自定义SLA)等。 查看SLA记录 登录COC。 在左侧菜单栏选择“基础配置
自动化运维 补丁管理 脚本管理 作业管理 定时运维 账号管理 参数中心
脚本工单 提供用户查看、操作脚本工单的能力。 前提条件 用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过云运维中心查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单