检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。 使用流程 混沌工程的基本流程如下图所示。
在实例控制台的监控列表页面新增一个Redis监控,配置监控信息。该监控器用于监控用户业务所使用的Redis,并且在数据中心1异常后自动将业务流量切换到数据中心2。 新增MongoDB监控 在实例控制台的监控列表页面新增一个MongoDB监控,配置监控信息。该监控器用于监控用户业务所使用的MongoDB数据库,并且
查看故障模式 针对ECS弹性云服务器、Docker容器、CCE、中间件、等不同对象提供CPU、内存、网络、进程等故障注入的故障模式,通过故障模式库提供各类故障的快速浏览和查询的能力。 查看故障模式 登录MAS控制台。 单击“混沌工程>故障模式库”,进入故障模式库页面。 选择故障模式类型、故障类型、故障模式并设置参数。
命名空间 多活管理 应用管理 MySQL/Oracle/PostgreSQL监控 Redis监控 MongoDB监控 Elasticsearch监控 API监控 工作流管理 混沌工程 数据管理 凭证管理 事件监控 查看审计日志 多活高可用服务 多活高可用服务(Multi-Site High
单击“应用列表”选择本项目应用,查看应用ID,即为props.appId。 单击“监控列表”选择本项目监控器,查看监控器ID,即为props.monitorId。 单击“监控列表”,在本项目监控器所在行单击“编辑”,在“编辑监控”页面单击“连接池配置”,在“数据中心”页签下的“数据源名称”就是props
登录MAS控制台,进入“工作流管理>工作流列表”页面。 单击待查看的工作流名称,进入“执行详情”页面。 图1 执行详情 单击任务的,查看任务执行的日志信息。 查看日志只显示7天内的日志信息。 单击任务的,查看任务更多执行信息。 如果工作流执行失败,可以重试单个失败任务,跳过单个失败任务,重试所有失败任务。 单击“执行”,可以重新执行工作流。
deleteApplication 批量切换应用监控 application batchSwitchMonitor 创建监控器 monitor createMonitor 更新监控器 monitor updateMonitor 删除监控器 monitor deleteMonitor 设置监控全局配置 monitor
具体要求见下表。 实例规格 虚拟机数量(台) CPU 内存(G) 磁盘io(读+写)(MB/s) 系统盘(G) 数据盘(G) 系统架构 网络带宽性能 主多活分区 3 >=8 >=16 >=350 >=100 >=100 x86_64架构 安装时带宽: >=10MByte/s 运行时带宽:
根据业务发展需要,您可以随时变更功能模块、增删多活实例或增删应用及监控。除此之外,你还可以实时查看监控指标,以便及时了解多活高可用服务的监控状态。 用户指南 开始使用MAS 功能模块 命名空间 多活管理 应用管理 监控管理 工作流管理 数据管理 凭证管理 事件监控 查看审计日志 权限管理 06 实践 介绍
ECS”。 选择“远程安装”。 选择UniAgent版本。 选择安装机。 添加UniAgent主机,配置如下信息。 表1 配置UniAgent主机 参数 配置说明 主机IP 请输入主机IP。 登录账号 说明: 请使用root用户。 请输入登录账号。 登录端口 请输入登录端口。 密码
于正常运行状态。 故障注入探针提供各类故障脚本,安装故障注入探针前需先完成UniAgent探针的安装, UniAgent探针负责打通VPC网络传递变更指令。 安装探针包括“远程安装”和“手动安装”两种方式,第一次安装需要使用“手动安装”的方式,VPC里面有一台安装机后才可以采用远程安装方式。
添加UniAgent主机,配置如下信息。 表1 配置UniAgent主机 参数 配置说明 主机IP 请输入主机IP。 登录账号 说明: 请使用root用户。 请输入登录账号。 登录端口 请输入登录端口。 密码 说明: 只作为安装使用,不保存。 请输入密码。 连接测试结果 连接测试后显示结果。 操作
选择故障场景标签,最多支持4个标签。可选如下标签: 中间件 云原生 容器 容灾演练 数据库 网络 虚机 描述 输入故障场景描述。 在“场景编排”区域中,单击“添加步骤”,选择故障类型,可选择“主机”或“K8S”两种类型。 多个步骤之间是串行的关系。每个步骤里面可添加并行故障。最多可添
多活管理 购买多活管理中心 购买边缘版实例 编辑多活管理中心名称和描述 ETCD证书下载 ETCD密码重置 更改实例安全组 多活分区监控 多活监控看板 计费模式变更 删除多活管理中心
命名空间 10 系统支持的命名空间数量。 多活管理中心 10 系统支持的多活实例数量。 应用 200 单个实例支持的应用数量。 监控器 100 单个实例支持的监控器数量。 数据源 200 单个命名空间支持的数据源数量。 数据同步 100 单个命名空间支持的数据同步数量。
编辑同步链路 √ √ × 删除同步链路 √ × × 查看同步链路详情 √ √ √ 监控器切换 √ √ × 新增监控 √ √ × 监控配置 √ √ × 编辑监控 √ √ × 切换数据中心 √ √ × 删除监控 √ √ × 连接池配置 √ √ × SDK接入配置 √ √ × 添加密钥 √
展示当前应用的评估历史记录,评估报告上限显示32个(其中手动评估报告上限30个),可以删除评估历史记录(最近的一条无法删除)。支持对评估报告进行差异分析。支持下载评估报告。单击评估历史记录名称,可以进入评估报告界面,查看评估报告。 推荐告警 展示生成的推荐告警规则,可将告警规则发布至监控服务。 故障注入
#应用id,从MAS服务实例页面查询获取 monitor-id: xxxx #监控器id,从MAS服务实例页面查询获取MAS监控id databaseName: xxxx #MAS监控的Mongo数据库 azs: az1 # etcd配置,对接
每个多活实例都部署在某个虚拟私有云(VPC)中,并绑定具体的子网和安全组,通过这样的方式为MAS提供一个隔离的、用户自主配置和管理的虚拟网络环境以及安全保护策略。 创建VPC和子网的操作指导请参考创建虚拟私有云和子网,若需要在已有VPC上创建和使用新的子网,请参考为虚拟私有云创建新的子网。
实施步骤 添加数据源 创建同步链路 创建应用 创建MySQL监控 应用接入SDK 故障切换演练 父主题: 同城多活改造实践