检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
软件系统类故障 应用程序类 表1 应用程序类参数配置 故障类型 故障模式 设置参数 进程 杀进程 process 进程持续异常,即使重新拉起也会被再次杀掉 process Java程序类 表2 Java程序类参数配置 故障类型 故障模式 设置参数 Java进程 Java进程内存溢出
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“事件监控”,进入“事件监控”页面。 在“事件监控”页面,默认展示近24小时的所有系统事件与自定义事件。 单击具体事件右侧的操作列的“查看监控图表”,可查看具体事件的监控图表。 父主题: 事件监控
在事件列表页面,单击页面右上角的“创建告警规则”。 根据界面提示,配置告警规则名称、告警策略、告警通知等参数,其中: 告警类型:选择“指标”或“事件”。 事件类型:选择“系统事件”。 事件来源:选择“MAS”。 图1 创建告警规则 其他参数请参考创建事件监控的告警通知,告警规则创建完成后,当事件监控指标触发设定
多活监控看板 多活监控看板统计当前多活管理中心下的各种监控数量和应用数量,以及监控状态和状态百分比。 查看多活监控看板 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在“基本信息”页面查看多活监控看板。 单击监控环形图标,可以跳转至“监控列表”页面,查看具体的监控状态。
使用单个AZ/Region无法满足高可靠诉求; 系统容量达到瓶颈或者访问时延无法达到要求; 云厂商技术绑定,无法获得先进技术和价格优势; 业务爆炸式增长带来的技术瓶颈。 多活高可用服务(Multi-Site High Availability Service,简称MAS)源自华
查看实验报告 混沌实验报告和混沌实验组报告提供详细的实验评估报告,涵盖执行结果、PerfTest背景流量业务指标以及AOM系统资源监控信息。 故障演练报告提供整体的和应用维度的故障注入、故障感知、故障定界、业务恢复等演练数据。 查看实验报告 登录MAS控制台。 单击“混沌工程>实验报告”,进入“实验报告”页面。
MAS入门简介 多活高可用服务(Multi-Site High Availability Service,简称MAS)源自华为消费者多活应用高可用方案,提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 使用条件 已注册华为账号并开通华为云。
主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
合,包括了流量入口、多活分区、数据同步、数据监控等内容。用户可以创建多个命名空间,用于逻辑隔离不同的资源。一般推荐按照企业的系统划分,比如OA系统,支付系统等可以各建一个命名空间。 实例 MAS向用户提供服务的最小资源单位。 购买一个多活管理中心即创建一个多活实例,多活实例是一个
/etc/bashrc问题的自处理方法 问题现象 报错内容: /etc/bashrc: line 101: TMOUT: readonly variable parse fail 创建应用-> 纳管k8s资源时发生报错。 图1 纳管k8s 故障注入时发生报错。 图2 故障注入 根因分析 由于混沌工程是使用unia
MAS自定义策略 如果系统预置的MAS权限,不满足您的授权要求,可以创建自定义策略。目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以
主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
集合,包括了流量入口、多活分区、数据同步、数据监控等内容。您可以创建多个命名空间,用于逻辑隔离不同的资源。一般推荐按照企业的系统划分,比如OA系统、支付系统等可以各建一个命名空间。 创建命名空间 登录MAS控制台,在“空间管理”页面,单击右上角的“创建命名空间”。 在“创建命名空
开始使用多活高可用服务 多活高可用服务(Multi-Site High Availability Service,简称MAS)源自华为消费者多活应用高可用方案,提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 使用条件
创建故障演练 故障演练是一种通过注入大规模的体系化故障来模拟各类真实的系统故障,从而验证系统可靠性和技术团队应急响应能力的工程实践。 创建演练 登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练
例创建、删除权限。 系统策略 无 MAS ReadOnlyAccess 多活高可用服务只读权限,拥有该权限的用户仅能查看多活高可用服务数据。 系统策略 无 表2列出了MAS常用操作与系统策略的授权关系,您可以参照该表选择合适的系统策略。 表2 常用操作与系统策略的关系 操作 MAS
回显如下则说明Docker运行成功。 CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 磁盘挂载 以下操作需在每台虚拟机上都执行。 以root用户登录待挂载虚拟机。 查看磁盘情况。 fdisk -l 系统显示如下信息,表示系统有一个空间为500G的
配额说明 配额是指您在MAS系统中可创建的资源数量限制,具体的资源配额限制如表4-1 MAS配额规格所示。 表1 MAS配额规格 资源名称 配额(个) 备注 命名空间 10 系统支持的命名空间数量。 多活管理中心 10 系统支持的多活实例数量。 应用 200 单个实例支持的应用数量。
多的冗余成本,提高了统一的资源利用率,同时降低成本。 异地多活 多活业务中至少一个多活子信息系统与其他子系统处于不同地理区域,建议物理距离>300KM。 业务连续性:跨地域容灾&多活,系统容量翻倍,对外SLA极大提升。 管理一致: 两个数据中心架构一致,管理操作一致,多活管控一致。
Service,CTS)可以记录MAS相关的操作事件,用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 开通了云审计服务后,系统开始记录MAS资源的操作。云审计服务管理控制台保存最近7天的操作记录。 开通云审计服务 云审计服务的开通请参见开通云审计服务。 开通云审计