检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
混沌工程(ChaosEngineering)是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
本章节指导您将UniAgent接入CCE。 远程安装步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用。 单击右上角的“UniAgent安装”,进入UniAgent安装页面。 选择“云容器引擎 CCE”。 选择“远程安装”。 选择UniAgent版本。
参数 配置说明 任务所在region 选择任务所在区域。 凭证 选择凭证,默认显示当前命名空间多活分区下已配置的默认凭证。 项目 选择项目,默认显示当前命名空间多活分区下已配置的默认项目。 任务 选择DRS任务。 对象级对比 选择“关闭”或“开启”。 说明: 数据对比和对象对比必须要有一个开启。
内置注入故障 带波动的延时故障 基于延时基数和抖动幅度创建带有波动的延时故障。具体触发要结合故障注入功能是否开启、注入故障概率、延时注入开关、延时故障生效概率决定。 异常故障 内置如下异常故障,结合故障注入功能是否开启、注入故障概率、异常注入开关、异常故障生效概率决定是否触发,触发故障为对应模块随机一种异常。
由于混沌工程是使用uniagent来执行脚本的,获取自建k8s机器信息和注入故障都需要在主机上执行相关命令,uniagent在执行脚本前会加载用户的环境变量配置,会执行 source /etc/bashrc这个命令,由于主机上的这个文件有错误,就会导致执行的时候产生错误流。影响脚本的真实结果,导致出现这个问题。
MAS APIG在当前用户方案中是两边都部署吗?还是只在华为侧部署,再指向第三方云的网关? 两边云都部署,通过APIG-Site部署模式,管理面在华为云,数据面都下沉到了第三方云(提供第三方云资源服务器,通过华为云IEF部署)。 父主题: 多活容灾方案相关问题
本章节指导您将探针接入自建K8S。 操作步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管自建K8S资源。 选择“云服务-自建K8S”页签。 单击操作列“安装探针”。 等待探针状态从“部署中”变成“运行中”
string 只能是“dc1”或“dc2”。 激活的Redis。 chaos 否 InjectionProperties 请参考InjectionProperties数据结构说明 故障注入相关配置。 表2 RedisConfiguration数据结构说明 参数名称 是否必选 参数类型 取值范围
nOptions.builder().build()) 此session对应的Mongo数据源为当前active数据源。所以在使用session相关的操作时,请务必保证所有操作都能路由到active数据源。 在本地读单边写模式下,如下使用方式会抛出异常:java.lang.IllegalStateException:
混沌工程 混沌工程概述 故障模式库 创建应用 安装探针 创建混沌实验 创建混沌实验组 故障场景库 创建故障演练 查看执行记录 查看实验报告
约束 MAS-Mongo-SDK的多活容灾能力需要数据同步服务和MAS DCG服务支持,SDK本身不支持数据同步,SDK本身也不支持故障动态切换数据源能力,需要配合MAS DCG服务一起使用。 版本约束 多活容灾MongoDB监控准备 父主题: MAS-Mongo-SDK使用手册
在使用MAS-DB-SDK进行开发前,需要先做好如下准备: 已创建MAS实例。 在实例下已创建对应的监控器。 请参考MySQL/Oracle/PostgreSQL监控管理,配置多活容灾MySQL/Oracle/PostgreSQL监控。 父主题: 约束
读操作:同步路由到指定的Redis。 写操作:同步路由到指定的Redis,同时异步发送到远端Redis。 此场景下可切换指定的Redis。 当不同实例内SDK操作同一个Redis key时,不能保证两个Redis的一致性。 当SDK发生Redis切换时,切换前产生的异步双写命令和切换
单击“混沌工程>实验报告”,进入“实验报告”页面。 单击“混沌实验”/“混沌实验组”页签,可分别查看对应页签的实验报告。 单击实验报告所在行的“实验报告”,可跳转至具体的报告页面进行查看。 图1 实验报告 单击实验报告所在行的“删除”,单击“是”,可删除此条实验报告。 查看演练报告 登录MAS控制台。 单击
方案概述 应用场景 MAS通过工作流编排和执行,提供业务进行跨区域容灾双活切换的完整流程。MAS工作流提供如下能力: 提供切换流程编排功能,可以一键式流程切换。 提供丰富插件,可实现各层级的切换/操作能力。 支持工作流模板,通过模板可快速完成复杂的容灾切换工作流的创建。 父主题:
磁盘IO高 disk;usage 网卡 网卡down dev_name 网络通信类 表2 网络通信类参数配置 故障类型 故障模式 设置参数 网络-数据链路层 链路层(指定端口)网络时延 dev_name ;port;delay 链路层(指定端口)网络丢包 dev_name ;port;loss_rate
入门实践 当您开通了多活高可用服务后,可根据业务需要提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 本文介绍多活高可用服务入门实践,帮助您更好的使用多活高可用服务。 表1 入门实践 实践 描述 商城应用改造 介绍如何基于MAS将一个商城应该改造为多活高可用。
disk ;operate POD 停止工作负载实例 cluster_name ;namespace ;workload_name 网络-数据链路层 工作负载链路层网络时延 cluster_name ;namespace ;workload_name ;dev ;delay 工作负载链路层网络丢包
MAS是一个产品还是方案? MAS是一个完整的应用多活高可用解决方案。 MAS=多活接入服务+应用层SDK+数据同步管道+统一管控中心。 完整可落地方案=技术产品(MAS)+咨询服务+生态伙伴+容灾规范。 父主题: MAS产品相关问题
在指定的时间内为实例续费,否则实例会删除,数据丢失且不可恢复。 续费操作仅适用于包年/包月的实例,按需计费的实例不需要续费,只需要保证账户余额充足即可。 实例在到期前续费成功,所有实例资源得以保留,且实例的运行不受影响。实例到期后的状态说明,请参见到期后影响。 续费相关的功能 包年/包月实例续费相关的功能如表1所示。