检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
填写WarRoom信息 若在拉起Warroom的时候需要同时拉起群组(群组方式支持企业微信和钉钉),需要配置以下信息: (1)在移动应用管理中配置对应用。 (2)在人员管理中配置企业微信对应邮箱。 (3)若选择排班,需要先创建排班并给排班中添加排班人员,添加排班和参与者后,会在起会规则命中时拉入企业微信。
按照资源类型汇聚,支持按照标签查询资源列表,并提供UniAgent安装能力。 Global 应用管理 COC提供以应用为中心的资源管理视图。提供应用和资源关联关系的建模能力。按照“应用 > 区域 > 分组 > 资源模型”进行管理,支持按照标签查询资源列表,并提供UniAgent安装能力。
目标来源分为弹性云服务器 (ECS)、云容器引擎 (CCE)、云数据库(RDS)、分布式缓存服务(DCS)和文档数据库服务(DDS),单击“下一步”(以ECS为攻击目标为例,根据需要攻击的应用,选择该应用下的ECS实例)。 图4 选择攻击目标为弹性云服务器 (ECS) 选择攻击场
面。在页面右上角可以看到WarRoom状态。 单击最右侧的更新状态按钮,可以更新WarRoom状态到对应的状态。 1.故障已恢复之前受影响应用必须先走到已恢复状态 2.WarRoom关闭之前,要填写WarRoom故障信息 父主题: WarRoom
at脚本,并对脚本内容进行高危命令校验。 脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接,需要用户自行修改解释器,适配为机器可执行的解释器。 图3 录入脚本内容 单击“校验高危命令”,可对脚本内容进行高危检测。
SLO管理 月度应用实际达成的SLO情况 月度SLO实际值=1-(月度应用不可用时长/月度应用总时长)*100%; 单个区域多应用SLO实际值=avg(月度SLO实际值); 多个区域单应用SLO实际值=min(月度SLO实际值); 多个区域多应用SLO实际值=avg(多个区域单应用SLO实际值);
即可清空排班。 图3 全局轮班场景清空人员 应用排班+固定班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景、区域及应用,单击“操作”列的“编辑”可增加或删除排班人员。 图4 应用固定场景修改人员 应用排班+轮班班次 登录COC。 在左侧导航栏选择“基础配置
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班。 排班维度 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关。 应用排班:排班需按照应用,Region(可选)创建,不同应用排班不同。 提交后会跳转至排班完成页面,单击“排班人员”。不同排班方式会和排班维度组合添加人员
复而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理 与会成员 进展通告 新增起会规则 修改起会规则 父主题: 故障管理
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同 场景描述:排班场景的详细说明 单击排班场景的“操作”列中“创建排班角色”可为该场景创建排班。
单击右上角“创建SLA”,进入“创建SLA”页面。 图5 创建自定义SLA 填写SLA名称、描述、触发类型、选择级别、应用信息,当选择部分应用时,弹出下拉选择框,支持搜索应用,可多选,可全选,如表1所填写 图6 选择应用 表1 参数说明 参数名称 参数说明 SLA名称 必选参数。 由中文、字母、数字、中划线、
在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号管理”页签,可通过资源视角和应用视角来管理主机。资源视角针对购买的所有主机实例,应用视角针对购买的并已绑定应用的主机。 图1 帐号管理概览 若用户只想托管(只保存作用,不改密)主机帐号密码,可通过“导入帐号”的
输入框可编辑参数值。 d.输入执行用户,输入超时时间。 e.选择实例方式分为手动选择:用户手动勾选实例。选择全部:选择单region或者单应用关联的全部实例。 手动选择实例方式:单击“添加实例”,弹出实例选择弹窗。选择方式“手动选择”,根据“企业项目““视图类型““资源类型”、“
运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练 02 入门
API 应用资源管理 脚本管理 脚本工单 故障管理 补丁管理
改进单。改进单后续处理参考改进管理。 图6 创建改进事项 表1 改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC