检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
软件系统类故障 应用程序类 表1 应用程序类参数配置 故障类型 故障模式 设置参数 进程 杀进程 process 进程持续异常,即使重新拉起也会被再次杀掉 process Java程序类 表2 Java程序类参数配置 故障类型 故障模式 设置参数 Java进程 Java进程内存溢出
混沌工程(ChaosEngineering)是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
议及优化后的RTO/RPO目标。 自动化推荐告警:提供针对应用的监控告警列表,并允许租户添加到CES/AOM中。 故障注入:提供针对应用的故障注入用例,并允许租户注入到CAST/PerfTest中。 优化建议:根据自动检查识别出的风险点给出优化建议。 历史记录:可以保存、查看应用
工拥有唯一安全凭证,并使用MAS资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将MAS资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳
提供混沌实验、混沌实验组和故障演练的记录。 查看执行总览 登录MAS控制台。 单击“混沌工程>执行记录”,进入“执行记录”页面。 单击“故障演练”页签,可查看执行记录。 故障演练的执行记录跟实验和实验组的执行记录不同,演练的执行记录需要在“记录组”回填响应的数据,回填的数据在大屏和演练报告会作为数据源展示出来。
对于K8S类型故障,需要选择完K8S集群攻击目标之后才能进行完整的故障模式参数配置。后台通过调用K8S的API Server进行命名空间、工作负载等参数的查询,并通过下拉框的方式提供给用户选择。 配置完成后单击“保存”,即可生成混沌实验组。单击“混沌实验组”菜单,可以对新创建出来的实验组进行查看、编辑、执行等操作。
单击“下载边缘节点配置文件”,下载包含以上边缘节点密钥等信息的配置文件。 将边缘节点连接上云。完成所有边缘节点的纳管,即可部署MAS实例。 不同可用区的华为云边缘节点要求纳管节点的时候纳管到华为云上不同的可用区。 单击“下载核心软件安装工具”,下载安装程序:a. edge-installer_1
一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群,一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 如果您需要提高应用的高可用性,建议您将多活实例创建在不同的可用区内;如果您需要较低的网络时延,建议
划分成多个集群,一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 软件开发工具包(SDK):SDK 的全称是 Software Development Kit,是一种被用来辅助开发某类软件而编写的特定软件包。 RPO(Recovery Point
偏差。您可以选择合适的NTP服务器进行时间同步,从而保持时间一致。配置方法可参考如何同步NTP服务器中的操作步骤。 安装增熵软件确保系统可以快速生成安全随机数。 根据操作系统类型安装并启动增熵软件。 euleros和centos可参考以下方法安装haveged进行增熵: yum install
混沌工程(ChaosEngineering)是一种通过主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
用高可用方案,提供从流量入口、数据到应用层的端到端的业务故障切换及容灾演练能力,保障故障场景下的业务快速恢复,提升业务连续性。 使用条件 已注册华为账号并开通华为云。 当前登录账号拥有使用MAS的权限。账号权限授权与绑定,请参考创建用户并授权使用MAS。 登录多活高可用控制台 登录华为云控制台。
务资源的访问。 通过IAM,您可以在华为云账号中给员工创建IAM用户,并使用策略来控制员工对云服务资源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有MAS的使用权限,但是不希望他们拥有删除MAS实例等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予
故障模式库 查看故障模式 基础设施类故障 软件系统类故障 容器类故障 Kubernetes集群 云服务故障 父主题: 混沌工程
MAS通过应用来实现同一实例内不同用户间的资源隔离,用户在实例中创建的资源(MySQL监控、Redis监控等)都要归属到某个应用下,IAM用户默认只能查看和管理自己创建的应用和资源,无法查看其他IAM用户创建的应用和资源,主账号可以查看和管理其下所有IAM用户所创建的应用和资源。 创建应用 登
单击“人员安排”页签的“设置”,在“成员管理”弹窗中勾选姓名和角色,并单击“确定”。 表2 参数说明 参数名称 说明 蓝军 负责故障演练的规划和执行,作为故障演练的攻击方,拥有故障演练的所有权限。 记录组 负责对故障演练的执行详情进行记录和修正,拥有执行记录和演练报告的编辑权限。 监督组
执行工作流 执行已编排好的工作流,实现业务容灾切换的完整流程。 前提条件 已创建“异地容灾”类型的命名空间,如何创建命名空间请参考创建命名空间。 在命名空间下已购买执行工作流的多活管理中心,创建多活实例请参考购买多活管理中心。 在命名空间下已创建并编排好工作流。 操作步骤 登录M
包年/包月是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择包年/包月的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍包年/包月MAS实例的计费规则。 适用场景 包年/包月计费模式需要用户预先支付一定时长的费用,适用于长期、稳定的业务需求。以
95%,要求业务双活的容灾场景。 同城跨AZ的应用数据多活,并分担部分业务流量。 场景三:两地三中心 适用于容灾可用性要求达到99.99%,同时进行跨AZ和跨Region容灾场景。 同城双活+异地灾备,提供最高程度的业务连续性和数据可用性保障。 场景四:异地多活(单元化) 适用于容灾可用性要求达到99
单击右上角的“创建应用”。 配置应用基本信息。 表1 应用基本配置 参数 配置说明 名称 自定义应用名称。 描述 填写对该应用的描述内容,选填项。 该应用是否允许纳管其他应用下的资源 开启时,可以纳管已被其他应用纳管的资源。 服务 选择云服务。 资源类型 展示所选云服务下包含的资源类型。