检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。 使用流程 混沌工程的基本流程如下图所示。
utMS 否 Integer 服务器选择超时(以毫秒为单位)。 localThresholdMS 否 Integer 当与副本集中的多个MongoDB实例进行通信时,驱动程序只会将请求发送到响应时间小于或等于响应时间最快的服务器加上本地阈值的服务器,以毫秒为单位。 heartbeatFrequencyMS
查看故障模式 针对ECS弹性云服务器、Docker容器、CCE、中间件、等不同对象提供CPU、内存、网络、进程等故障注入的故障模式,通过故障模式库提供各类故障的快速浏览和查询的能力。 查看故障模式 登录MAS控制台。 单击“混沌工程>故障模式库”,进入故障模式库页面。 选择故障模式类型、故障类型、故障模式并设置参数。
空间管理 概述 命名空间(Namespace)承载整个多活项目的资源集合,包括了流量入口、多活分区、数据同步、数据监控等内容。您可以创建多个命名空间,用于逻辑隔离不同的资源。一般推荐按照企业的系统划分,比如OA系统、支付系统等可以各建一个命名空间。 创建命名空间 登录MAS控制台
帮助用户分析华为云云上资源部署情况,识别风险点并给出建议, 提升云上业务的稳定性。 应用韧性主要包括如下功能点: 描述应用:描述客户应用架构,涵盖应用内云服务器资源及关联关系;支持租户授权评估。 定义目标:明确应用重要性及需要评估的故障场景。 韧性评估:能够自动对应用架构内的资源,进行扫描检查,
咨询服务+生态伙伴+容灾规范。 MAS产品优势如下: 业务级高可用保障。 流量、业务、数据端到端可用。 秒级RTO、RPO,保证业务连续性。 低成本容灾演练能力。 MAS核心能力包括: 端到端(管理-流量-应用-数据)仲裁和多活容灾管控。 安全可靠的数据同步管道。 可落地的多活容灾标准规范。
的可用性,进行入口DNS的解析结果控制。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 红色 监控异常。从正常到异常,自动触发流量切换。 黄色 初始化监控失败。此状态表示MAS进程无法检测到业务API,确保配置信息无误的情况下,需要联系运维处理。 浅灰 监控未生成或监控配置错误。
探针接入ECS 本章节指导您将探针接入ECS。 操作步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管ECS资源。 选择“弹性云服务器 ECS”页签。 单击操作列“安装探针”。 待探针状态显示运行中,则安装完成。
选择记录集类型。 A – 将域名指向IPv4地址 CNAME – 将域名指向另外一个域名 MX – 将域名指向邮件服务器地址 TXT – 设置文本记录 SRV – 记录提供特定服务的服务器 记录集的值 填写记录集的值。 主机记录 填写主机记录。 主机记录指域名前缀,如不填写,默认添加时使用内
理距离<50KM。 业务连续性: 不同于容灾,实时流量分摊,故障快速切换。 水平可扩展:为业务的高速发展提供了支撑。 流量隔离: 灵活调度流量,相互隔离,实现业务的不断创新和试验田。 降本增效: 多活相比传统容灾提供了更优秀的流量分发机制,不需要承载太多的冗余成本,提高了统一的资源利用率,同时降低成本。
数据灾备场景。 场景二:同城双活 适用于容灾可用性要求达到99.95%,要求业务双活的容灾场景。 同城跨AZ的应用数据多活,并分担部分业务流量。 场景三:两地三中心 适用于容灾可用性要求达到99.99%,同时进行跨AZ和跨Region容灾场景。 同城双活+异地灾备,提供最高程度的业务连续性和数据可用性保障。
egion通过VPN网络纳管新加坡国际站的资源;从上海1通过专线纳管线下私有云接入进来的资源;从北京4通过公网IP纳管其他云厂商平台上的虚拟机资源。 创建应用-当资源类型选择为主机 登录MAS控制台。 单击“混沌工程>应用管理”,进入“应用管理”页面。 单击右上角的“创建应用”。
单位选择min(分钟),输入值必须在0到60之间。 设置高级配置。 配置背景流量,背景流量功能需要当前系统环境已部署CodeArts PerfTest服务才可见,并已创建PerfTest测试工程任务。 在“高级配置”页签,单击“添加背景流量”。 在“背景流量”弹窗中选择工程名、任务名称、资源组类型。 表3 参数说明
ROUND_ROBIN是轮询。 router.nodes.ds1.master 主数据源 空 当slaves为空时,读写流量都在master 当slaves不为空时,读流量在slaves,写流量,DDL,事务操作在master。 router.nodes.ds1.slaves 读写分离读数据源列表
云服务故障 表1 云服务 故障类型 故障模式 设置参数 弹性云服务器 ECS 启动弹性云服务器 关闭弹性云服务器 重启弹性云服务器 - 裸金属服务器 BMS 启动裸金属服务器 关闭裸金属服务器 重启裸金属服务器 - 云硬盘 EVS 删除云硬盘 - 云硬盘快照 EVS_SNAPSHOT
本章节指导您将UniAgent接入CCE。 远程安装步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用。 单击右上角的“UniAgent安装”,进入UniAgent安装页面。 选择“云容器引擎 CCE”。 选择“远程安装”。 选择UniAgent版本。
t探针的安装, UniAgent探针负责打通VPC网络传递变更指令。 安装探针包括“远程安装”和“手动安装”两种方式,第一次安装需要使用“手动安装”的方式,VPC里面有一台安装机后才可以采用远程安装方式。 父主题: 安装探针
多活高可用服务(Multi-Site High Availability Service,简称MAS)源自华为消费者多活应用高可用方案,提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 本手册基于一个GitHub上的商城
使用MAS实现API异常监控 概述 API监控可实现监控用户业务APIG入口的可用性。配置告警前提下,当APIG异常时,API监控在监测到该异常后会立即发送告警通知给用户。 本章通过完成一个样例帮助您快速熟悉使用API监控实现API异常监控的过程。使用API监控的步骤如下所示: 步骤一:创建MAS应用
本章节指导用户在应用详情页面下的故障注入页签进行相关操作。 在“应用详情”页面,进入“故障注入”页签。 针对状态为“未发布”状态的混沌实验,单击操作列“配置”可配置CPTS背景流量(可选步骤),配置完成之后单击“确定”按钮。 选择待发布的实验条目,单击“批量发布混沌实验”,可以将应用韧性Hub的实验发布至CAST平台。