检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
脚本支持“Shell”、“Python”、“Bat”三种命令,支持全局参数和关联参数仓库。 注意事项 确认脚本内容的风险等级,并如实填写风险等级。 创建自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。
确定性故障管理 统一事件中心:提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。 承载Warroom和故障回溯能力:现网事件智能启动Warroom,缩短故障处理非必要耗时,指挥中心实时观测故障处理进展。
补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。
委托用于支持管理员切换到执行账号身份进行作业工单创建以及跨账号实际目的操作,以跨账号创建CES告警规则为例,跨账号实际目的操作有三个:创建SMN主题、SMN主题添加订阅和创建CES告警规则,所以实际创建的执行账号委托除了需要支持管理员能够切换到执行账号身份进行作业工单创建外,还需要支持以上三个操作
运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练 02 入门 以快捷执行作业及快捷混沌演练为例
镜像与武器版本支持声明 COC混沌演练目前已支持弹性云服务器(ECS)、裸金属服务器(BMS)和Flexus应用服务器L实例(FlexusL)三种探针类武器的攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。
原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。
本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。
脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。
角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。
变更中心:变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 变更配置:承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。
选择排班角色,其中的排班人员在启动WarRoom时会被自动加入到第三方移动应用群组。 配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。
注意事项 若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常。 是否为Cloud Operations Center补丁管理支持操作系统。 该实例是否处于关机状态。 创建扫描任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。
目标实例目前仅支持弹性云服务器(ECS),裸金属服务器(BMS)和云耀FlexusL实例三种类型。 定时运维任务“状态”列为“正常”(免审批或已审批入库的)、“是否启用”列为“开启”才会自动执行脚本/作业。 父主题: 定时运维
步骤三:创建演练任务 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。 单击“演练任务”页签,进入演练任务页面。 单击“创建演练任务”,进入创建演练任务页面。 设置“基础信息”。
角色以服务为粒度,是IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。策略以API接口为粒度进行权限拆分,授权更加精细,可以精确到某个操作、资源和条件,能够满足企业对权限最小化的安全管控要求。 COC系统策略说明请参考COC权限管理。
生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。
步骤三:执行作业 通过云运维中心,租户可以操作ECS以自动化的方式执行作业。 准备工作 注册账号并实名认证。 在使用云运维中心之前,请先注册华为账号并开通华为云,然后实名认证。 如果您已开通华为云并进行实名认证,请忽略此步骤。 开通云运维中心。