正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器类故障 容器资源类 表1 容器资源类参数配置 故障类型 故障模式 设置参数 CPU 容器实例内CPU过载 类型:docker_id;配置参数:docker_id/usage 类型:docker_name;配置参数:docker_name/num/usag 内存 容器实例内内存过载
MAS服务多活管理中心Elasticsearch监控探测到Elasticsearch数据库实例状态异常。 用户登录MAS控制台->多活管理->指定实例->Elasticsearch监控,查看原因及处理异常。 可能导致用户ElasticSearch实例不可用。 MAS ElasticSearch状态恢复 重要
ID IMAGE COMMAND CREATED STATUS PORTS NAMES 磁盘挂载 以下操作需在每台虚拟机上都执行。 以root用户登录待挂载虚拟机。 查看磁盘情况。 fdisk -l 系统显示如下信息,表示系统有一个空间为500G的磁盘,盘符为/dev/vdb,请将磁
混沌工程概述 混沌工程(ChaosEngineering)是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的
创建故障演练 故障演练是一种通过注入大规模的体系化故障来模拟各类真实的系统故障,从而验证系统可靠性和技术团队应急响应能力的工程实践。 创建演练 登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练
创建混沌实验 混沌实验通过编排故障模式、攻击目标、攻击策略,将故障注入目标,得到一个符合混沌工程理论的实验,是最小的执行单元。 创建混沌工程 登录MAS控制台。 单击“混沌工程>混沌实验”,进入“混沌实验”页面。 单击右上角的“创建混沌实验”。 自定义输入混沌实验名称。 添加攻击目标。
监控配置 本章节指导用户配置全局监控参数。 在创建监控器时“高级配置”中已配置的监控参数,以“高级配置”中配置的值为准,不受全局监控配置影响。 操作步骤 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“监控配置”。
查看实验报告 混沌实验/组报告提供详细的实验评估报告,涵盖执行结果、PerfTest背景流量业务指标以及AOM系统资源监控信息。 故障演练报告提供整体的和应用维度的故障注入、故障感知、故障定界、业务恢复等演练数据。 查看实验报告 登录MAS控制台。 单击“混沌工程>实验报告”,进入“实验报告”页面。
故障注入探针 接入ECS 接入CCE 接入跨云IDC-主机 接入自建K8S 父主题: 安装探针
云服务故障 表1 云服务 故障类型 故障模式 设置参数 弹性云服务器 ECS 启动弹性云服务器 关闭弹性云服务器 重启弹性云服务器 - 裸金属服务器 BMS 启动裸金属服务器 关闭裸金属服务器 重启裸金属服务器 - 云硬盘 EVS 删除云硬盘 - 云硬盘快照 EVS_SNAPSHOT
默认“是”,选“否”则不会探测数据库异常情况。 是否自动切换 默认“是”,选“否”则不会自动切换数据库。 监控用户名 被监控的数据库的用户名。 监控用户密码 被监控的数据库的用户密码。 填写数据中心配置,完成后单击“下一步:数据库配置”。 图2 新增DDM监控-数据中心配置 表2 数据中心配置信息
RDS实例创建备份 DWS检查容灾任务 DWS容灾操作 DCS开启/关闭白名单 OBS桶存量比较 OBS跨区域复制任务设置 OBS桶策略操作授权用户 DNS添加记录集 DNS删除记录集 DNS公网域名记录集权重设置 Smart Connect任务操作 人工卡点 等待 AOM作业执行 混沌实验执行
购买多活管理中心 准备资源 创建实例 父主题: 多活管理
创建事件监控告警规则 操作场景 本章节指导用户针对MAS事件监控创建告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“事件监控”,进入“事件监控”页面。 在事件列表页面,单击页面右上角的“创建告警规则”。 根据界面提示,配置告警规则名称、告警策略、告警通知等参数,其中:
单击“一键切换”。 “API监控”不支持监控切换。 在弹窗中单击“确定”。 当检测到对端数据中心状态异常时,直接切换会提示切换失败。如果用户需要强制切换数据中心,需要勾选强制切换复选框,再单击“确认”进行切换。 图1 强制切换监控器 业务数据库故障,触发监控器自动切换时,切换操
Collectors; @Slf4j @Service public class RedissonClientStorage { // dcs的客户端 private final MultiZoneClient client; // dc1和dc2的RedissonClient
的业务快速恢复,提升业务连续性。 使用条件 已注册华为账号并开通华为云。 当前登录账号拥有使用MAS的权限。账号权限授权与绑定,请参考创建用户并授权使用MAS。 登录多活高可用控制台 登录华为云控制台。 单击,选择区域。 单击左上角,在服务列表选择“多活高可用服务 MAS”,进入多活高可用服务控制台。
查看执行记录 提供混沌实验、混沌实验组和故障演练的记录。 查看执行总览 登录MAS控制台。 单击“混沌工程>执行记录”,进入“执行记录”页面。 单击“故障演练”页签,可查看执行记录。 故障演练的执行记录跟实验和实验组的执行记录不同,演练的执行记录需要在“记录组”回填响应的数据,回
应用概述 对租户下的云服务资源按照应用维度进行统一纳管,此为故障注入前的准备工作,纳管后再为应用中的资源安装UniAgent和探针。混沌工程目前是region级服务,按照资源是否在当前region,应用可按照云服务和跨云跨IDC两个类别分别进行纳管。 父主题: 创建应用
云服务 本章节指导您如何创建云服务应用。 创建应用-当资源类型选择为云容器引擎CCE 当选择的资源类型为普通云服务,操作步骤如下,此处以选择“云容器引擎CCE”为例。 登录MAS控制台。 单击“混沌工程>应用管理”,进入“应用管理”页面。 单击右上角的“创建应用”。 填写“应用名称”。