检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多活高可用服务(Multi-Site High Availability Service,简称MAS)源自华为消费者多活应用高可用方案,提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 使用条件 已注册华为账号并开通华为云。
修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。 使用流程 混沌工程的基本流程如下图所示。
基本概念 命名空间 命名空间(Namespace)承载整个多活项目的资源集合,包括了流量入口、多活分区、数据同步、数据监控等内容。用户可以创建多个命名空间,用于逻辑隔离不同的资源。一般推荐按照企业的系统划分,比如OA系统,支付系统等可以各建一个命名空间。 实例 MAS向用户提供服务的最小资源单位。
概述 DDM监控器可对用户业务使用的DDM数据库进行探测,并且在数据库异常时自动触发流量切换。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 红色 监控异常。从正常到异常,自动触发流量切换。 黄色 初始化监控失败。此状态表示Monitor启动时初次监控探测失败,确保配置信息无误的情况下,需要联系运维处理。
MongoDB监控器可对用户业务使用的MongoDB数据库进行探测,并且在数据库异常时自动触发流量切换。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 红色 监控异常。从正常到异常,在允许自动切换的情况下,自动触发流量切换。 黄色 初始化监控失败。此状态表示Monitor启动时初次监控探测
理距离<50KM。 业务连续性: 不同于容灾,实时流量分摊,故障快速切换。 水平可扩展:为业务的高速发展提供了支撑。 流量隔离: 灵活调度流量,相互隔离,实现业务的不断创新和试验田。 降本增效: 多活相比传统容灾提供了更优秀的流量分发机制,不需要承载太多的冗余成本,提高了统一的资源利用率,同时降低成本。
务中如何查询。 etcd.apiVersion填写固定值V3。 etcd.httpsEnable的值取决于ETCD页面“etcd集群地址”访问是http,这里值为false;访问是https,这里值为true。查看方法参考props、etcd配置项在MAS服务中如何查询。 表3 sources数据源配置项
单位选择min(分钟),输入值必须在0到60之间。 设置高级配置。 配置背景流量,背景流量功能需要当前系统环境已部署CodeArts PerfTest服务才可见,并已创建PerfTest测试工程任务。 在“高级配置”页签,单击“添加背景流量”。 在“背景流量”弹窗中选择工程名、任务名称、资源组类型。 表3 参数说明
咨询服务+生态伙伴+容灾规范。 MAS产品优势如下: 业务级高可用保障。 流量、业务、数据端到端可用。 秒级RTO、RPO,保证业务连续性。 低成本容灾演练能力。 MAS核心能力包括: 端到端(管理-流量-应用-数据)仲裁和多活容灾管控。 安全可靠的数据同步管道。 可落地的多活容灾标准规范。
故障切换演练 查看监控器活跃的数据中心。 登录MAS控制台,在“多活管理”页面单击多活实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,查看创建的“litemall-db”MySQL监控器。 在未出现故障前,监控器的活跃数据中心为数据中心1,即主数据中心,此时商城应用是连接数据中心1。
多活高可用服务(Multi-Site High Availability Service,简称MAS)源自华为消费者多活应用高可用方案,提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 本手册基于一个GitHub上的商城
60M 499G 1% /opt/cloud/mas 检查端口 用户准备好虚拟机资源后,需要检查虚拟机是否开放了各组件需要的端口,具体端口信息如下: 端口需要保持内部互通。 表1 各组件开放的端口 组件 端口 ETCD 2379、2380 Monitor 8011、8099、8873
增删多活实例或增删应用及监控。除此之外,你还可以实时查看监控指标,以便及时了解多活高可用服务的监控状态。 用户指南 开始使用MAS 功能模块 命名空间 多活管理 应用管理 监控管理 工作流管理 数据管理 凭证管理 事件监控 查看审计日志 权限管理 06 实践 介绍具体应用样例的改
本章节指导用户在应用详情页面下的故障注入页签进行相关操作。 在“应用详情”页面,进入“故障注入”页签。 针对状态为“未发布”状态的混沌实验,单击操作列“配置”可配置CPTS背景流量(可选步骤),配置完成之后单击“确定”按钮。 选择待发布的实验条目,单击“批量发布混沌实验”,可以将应用韧性Hub的实验发布至CAST平台。
Eye)可以监控和查看云服务的运行状态、各个指标的使用情况,并对监控项创建告警规则。 当您开通MAS服务后,云监控服务会自动关联MAS的监控指标,帮助您实时掌握MAS的各项性能指标,精确掌握MAS的运行情况。 开通云监控服务 云监控服务默认开通使用。 如果需要查看MAS相关的监控指标,请参见查看云服务监控看板。
户在实例中创建的资源(MySQL监控、Redis监控等)都要归属到某个应用下,IAM用户默认只能查看和管理自己创建的应用和资源,无法查看其他IAM用户创建的应用和资源,主账号可以查看和管理其下所有IAM用户所创建的应用和资源。 创建应用 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。
新创建的MySQL监控器监控状态异常怎么处理? 确认配置MySQL监控时数据库的用户名、密码、IP地址与端口、数据库名称等信息是否正确,可以编辑监控器重新配置一遍。 确认添加MySQL监控的两个数据库实例是否存在且正常启动和运行。 确认数据库实例上是否已创建好需要监控的数据库。
数据灾备场景。 场景二:同城双活 适用于容灾可用性要求达到99.95%,要求业务双活的容灾场景。 同城跨AZ的应用数据多活,并分担部分业务流量。 场景三:两地三中心 适用于容灾可用性要求达到99.99%,同时进行跨AZ和跨Region容灾场景。 同城双活+异地灾备,提供最高程度的业务连续性和数据可用性保障。
tive,即yaml配置中的router.active)。 DCG为多活实例的仲裁中心,提供端到端(流量-应用-数据)仲裁和统一多活切换管控能力。 注解中的HintType用于查询时指定主从数据库,适用于读写分离场景,当前支持的配置值有:HintType.READMASTER(从master库读取)、HintType
果。 手动安装探针: 登录到机器,执行以下命令进入目录。 cd /opt/K8S ls 查看存在文件夹RASAgent 执行kubectl get pod -A | grep cast。查看探针安装详情。 如果显示ErrImagePull,说明当前集群的机器无法拉取默认镜像,此时