检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。 在集成管理配置页面根据业务需要选择
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情 所有用户可查看系统预置的公共SLA。 启用/禁用公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面,选择“公共SLA”页签,进入公共SLA界面。
使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。 补丁/脚本/作业/ECS操作 执行工单时,超时时间小于等于86400秒(即24小时)。 资源管理 安装UniAgent支持操作系统 目前支持的Linux操作系统版本有: EulerOS 2.2 64bit
补丁管理提供了用户能够管理ECS实例上补丁的能力。通过补丁管理能力,用户能够实现OS补丁合规性扫描,OS补丁合规性修复功能。 Global 批量ECS操作 批量ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 Global 批量RDS操作
应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 应急预案页面 单击“创建应急预案”,填写应急预案基本信息。
到期通知 到期通知时间必须小于到期删除时间 图1 到期通知时间大于到期删除时间 到期通知时间必须大于参数创建或修改的时间 图2 到期通知时间小于系统时间 父主题: 通知规则
资源操作工单 提供用户查看资源操作工单的能力。 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 通过Cloud Operations Center查看ECS工单、RDS工单、BMS工单、FlexusL工单。 操作步骤 登录COC。
持:刷新列表数据、设置列表展示字段。 图2 筛选SLA规则 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看SLA详情 系统做了租户隔离,仅能查看当前租户账号及其子账号创建的自定义SLA。 创建自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。
程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警 演练监控 弹性云服务器 资源运维中,可以对弹性云服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。混沌演练中,支持对弹性云服务器进行演练任务执行。 资源运维 混沌演练 云容器引擎 混沌演练中,支持对云容器引擎进行演练任务执行。
脚本工单 提供用户查看、操作脚本工单的能力。 前提条件 用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过Cloud Operations Center查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1
查看帐号基线 √ √ 创建帐号基线 x √ 策略授权系统权限 COC服务支持基于策略授权的授权模型。如表4 COC系统策略所示,包括了COC基于策略授权中的所有系统策略。策略授权的系统策略与角色授权的系统策略并不互通。 表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy
通过Cloud Operations Center ECS操作批量重启功能进行ECS实例批量重启。 注意事项 已关机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单击“批量重启”,进入“批量重启”页面。
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
未修改通知 未修改通知时间不能小于参数创建或修改的时间。 图1 通知时间小于系统时间 有到期删除策略时,未修改通知时间不能大于到期删除时间。 图2 未修改通知时间大于删除时间 父主题: 通知规则
批量ECS操作 ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源运维
图1 点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
目标来源分为弹性云服务器 (ECS)、云容器引擎 (CCE)、云数据库(RDS)、分布式缓存服务(DCS)和文档数据库服务(DDS),单击“下一步”(以ECS为攻击目标为例,根据需要攻击的应用,选择该应用下的ECS实例)。 图4 选择攻击目标为弹性云服务器 (ECS) 选择攻击场
1、导入形式的ECS资源帐号密码不参与纳管改密,若想对导入的帐号进行自动纳管,可以编辑全局基线或者创建帐号基线来添加对应帐号,则系统会对这些主机帐号密码进行立即纳管。 2、导入形式的DCS、RDS和DMS资源不参与纳管改密,帐号密码无法完成自动纳管改密。 若用户在OS上新增了主机帐