检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
混沌工程概述 混沌工程(ChaosEngineering)是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的
创建故障演练 故障演练是一种通过注入大规模的体系化故障来模拟各类真实的系统故障,从而验证系统可靠性和技术团队应急响应能力的工程实践。 创建演练 登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练
事件监控简介 概述 云监控服务(Cloud Eye)可以监控和查看云服务的运行状态、各个指标的使用情况,并对监控项创建告警规则。 当您开通MAS服务后,云监控服务会自动关联MAS的监控指标,帮助您实时掌握MAS的各项性能指标,精确掌握MAS的运行情况。 开通云监控服务 云监控服务默认开通使用。
设置 应用韧性Hub对云资料进行访问和授权技术专家查看并分析韧性Hub服务检查结果需要开启授权。 开启授权 登录MAS控制台。 单击“应用韧性Hub>设置”,进入“授权”页面。 开启如下权限。 云资源访问授权:授权应用韧性Hub访问您的云资源权限;关闭之后不能对应用进行评估。 MAS
删除应用 本章节指导用户删除应用。 登录MAS控制台。 单击“应用韧性Hub>应用”,进入“应用”页面。 选择需要删除的应用,单击“删除”。 (可选)勾选“是否需要删除混沌的应用和实验”、“是否需要删除远端告警记录”。 单击“确定”,删除应用。 父主题: 应用管理
故障注入探针 探针接入ECS 探针接入CCE 探针接入跨云IDC-主机 探针接入自建K8S 父主题: 安装探针
应用韧性Hub(Application Resilience Hub)基于华为内部IT最佳实践经验, 结合业界公有云方案,从应用可靠性角度, 帮助用户分析华为云云上资源部署情况,识别风险点并给出建议, 提升云上业务的稳定性。 应用韧性主要包括如下功能点: 描述应用:描述客户应用架构,涵盖
MAS服务多活管理中心Elasticsearch监控探测到Elasticsearch数据库实例状态异常。 用户登录MAS控制台->多活管理->指定实例->Elasticsearch监控,查看原因及处理异常。 可能导致用户ElasticSearch实例不可用。 MAS ElasticSearch状态恢复 重要
容器类故障 容器资源类 表1 容器资源类参数配置 故障类型 故障模式 设置参数 CPU 容器实例内CPU过载 类型:docker_id;配置参数:docker_id/usage 类型:docker_name;配置参数:docker_name/num/usag 内存 容器实例内内存过载
计费模式变更 按需转包年包月 包年包月转按需 父主题: 多活管理
查看执行记录 提供混沌实验、混沌实验组和故障演练的记录。 查看执行总览 登录MAS控制台。 单击“混沌工程>执行记录”,进入“执行记录”页面。 单击“故障演练”页签,可查看执行记录。 故障演练的执行记录跟实验和实验组的执行记录不同,演练的执行记录需要在“记录组”回填响应的数据,回
应用概述 应用对租户下的云服务资源按照应用维度进行统一纳管。 故障注入前需先创建应用,纳管资源后再为应用中的资源安装UniAgent和探针。 混沌工程目前是region级服务,按照资源是否在当前region,应用可按照云服务和跨云跨IDC两个类别分别进行纳管。 父主题: 创建应用
的业务快速恢复,提升业务连续性。 使用条件 已注册华为账号并开通华为云。 当前登录账号拥有使用MAS的权限。账号权限授权与绑定,请参考创建用户并授权使用MAS。 登录多活高可用控制台 登录华为云控制台。 单击,选择区域。 单击左上角,在服务列表选择“多活高可用服务 MAS”,进入多活高可用服务控制台。
查看实验报告 混沌实验报告和混沌实验组报告提供详细的实验评估报告,涵盖执行结果、PerfTest背景流量业务指标以及AOM系统资源监控信息。 故障演练报告提供整体的和应用维度的故障注入、故障感知、故障定界、业务恢复等演练数据。 查看实验报告 登录MAS控制台。 单击“混沌工程>实验报告”,进入“实验报告”页面。
ID IMAGE COMMAND CREATED STATUS PORTS NAMES 磁盘挂载 以下操作需在每台虚拟机上都执行。 以root用户登录待挂载虚拟机。 查看磁盘情况。 fdisk -l 系统显示如下信息,表示系统有一个空间为500G的磁盘,盘符为/dev/vdb,请将磁
创建混沌实验 混沌实验通过编排故障模式、攻击目标、攻击策略,将故障注入目标,得到一个符合混沌工程理论的实验,是最小的执行单元。 创建混沌工程 登录MAS控制台。 单击“混沌工程>混沌实验”,进入“混沌实验”页面。 单击右上角的“创建混沌实验”。 自定义输入混沌实验名称。 添加攻击目标。
监控配置 本章节指导用户配置全局监控参数。 在创建监控器时“高级配置”中已配置的监控参数,以“高级配置”中配置的值为准,不受全局监控配置影响。 约束与限制 “API监控”仅需配置“健康精度”,无需配置其他参数。 操作步骤 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。
购买多活管理中心 准备资源 创建实例 父主题: 多活管理
RDS实例创建备份 DWS检查容灾任务 DWS容灾操作 DCS开启/关闭白名单 OBS桶存量比较 OBS跨区域复制任务设置 OBS桶策略操作授权用户 DNS添加记录集 DNS删除记录集 DNS公网域名记录集权重设置 Smart Connect任务操作 人工卡点 等待 AOM作业执行 混沌实验执行
创建事件监控告警规则 操作场景 本章节指导用户针对MAS事件监控创建告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“事件监控”,进入“事件监控”页面。 在事件列表页面,单击页面右上角的“创建告警规则”。 根据界面提示,配置告警规则名称、告警策略、告警通知等参数,其中: