检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理
作业管理 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。 执行公共作业 创建自定义作业
改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 进入演练报告页面,单击“故障记录”,查看故障记录。
号管理”页面。 选择“帐号改密”页签下“改密任务”页签,配置需要开启定期改密的区域。单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作”列单击“查看任务详情”查看配置区域的改密任务,也可根据业务需求进行删除。 图1 配置改密任务 至此全部配置工作完
接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为
原子动作 原子动作定义了一个具体的操作内容,是作业的最小单位。 执行API 等待API结果 执行内容 父主题: 作业管理
变更配置 变更配置概述 承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。 审批配置:支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 审批配置 父主题: 变更管理
定时运维 定时运维向客户提供了定时或周期性的向特定实例执行特定脚本或者作业的功能。 定时任务管理 定时任务执行记录 Cron表达式使用 父主题: 自动化运维
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 创建应用 修改应用 删除应用 编辑应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作
脚本管理 提供用户自定义脚本的创建、修改、删除以及在目标虚拟机上执行自定义脚本、公共脚本的能力。通过该功能,用户可以通过自定义脚本或公共脚本在目标实例上执行操作。 创建自定义脚本 管理自定义脚本 执行自定义脚本 执行公共脚本 父主题: 自动化运维
选择“帐号改密”页签下“改密策略”页签,根据业务需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。
自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 在“定时运维”页面,单击列表数据操作列的“更多 > 历史记录”,跳转定时任务“历史记录”页面。 图1 查看执行情况 单击工单执行列表的“ID”列,跳转对应的脚本工单或者作业工单详情界面。脚本工单界面功能操作指导,请参照作业工单或脚本工单。
开通云运维中心并授权使用 开通云运维中心 角色授权的示例 策略授权的示例 跨账号管理
起会规则列表 在“起会规则”列表,选择需要修改的起会规则,单击“编辑” 修改起会规则。输入规则名称,选择区域,应用,事件级别,加入群组信息,完成后,单击“确定”修改起会规则。 图2 修改起会规则 修改完成,可以在起会规则列表查询修改后的规则。 父主题: WarRoom
操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作类“处理”,进入变更详情,点“变更开始”。若变更方案关联的作业,<需先执行作业;若是变更指导书,按照变更指导书步骤实施变更。 图1 变更实施开始 变更结束后,点“变更结束”,并填写变更结果
应用资源管理 租户委托查询租户的资源信息 父主题: API
在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“挂起”,页面会显示问题挂起弹窗页面,并填写挂起信息。 图1 问题单挂起 提交挂起后创建人点击问题单名称进入问题详情页面,单击页面右上角的“挂起审核”,填写审核信息并提交。提交后问
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
SLO管理 SLO(服务等级目标,Service Level Object),SLO管理目前对接Warroom、故障、告警等功能,自动化地完成SLO的计算,为SLO看板大屏提供数据。 查看SLO SLO指标配置 SLO中断记录 父主题: 基础配置