检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
批量重装操作系统 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L重装操作系统功能,您可以对Flexus L实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。
批量重装操作系统 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重装操作系统功能,您可以对BMS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
批量重装操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS重装操作系统功能,您可以对ECS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
自定义预案 操作场景 您可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 自定义预案页面 单击右上角“创建应急预案”,填写应急预案基本信息。
持:刷新列表数据、设置列表展示字段。 图2 筛选SLA规则 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看SLA详情 系统做了租户隔离,仅能查看当前租户账号及其子账号创建的自定义SLA。 创建自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。
64bit 对于Linux x86_64服务器,支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本。 安装UniAgent 登录云运维中心。
批量切换操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS切换操作系统功能,您可以对ECS实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
批量切换操作系统 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L切换操作系统功能,您可以对Flexus L实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。
该步骤介绍自定义监控系统接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理页面中选择“Other Monitoring Systems 自定义集成”,单击“接入集成”。 页面展示详细的集成接入步骤。 填写集成系统的简称和全称,单击“确认集成”。 集成自建监控系统告警。
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单
变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不使用系统预置的变更场
API请求的组成,并以调用IAM服务的获取用户Token来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。 请求URI 请求URI由如下部分组成:
安装探针、执行演练、清理环境三个步骤,系统会自动执行。执行时间视武器的攻击时间而定。 安装探针步骤会在目标机器上部署一个探针,该探针将会运行在系统中用于接收攻击、查询和清除等步骤的武器命令。在演练结束或终止操作后,清理环境步骤将停止其在系统中的所有操作并移除。 图6 攻击进行中 图7
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补丁
代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升
BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器 ECS √ √ √ √ √ √ 云数据库
告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,用户可以
t。 OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS