检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
软件系统类故障 应用程序类 表1 应用程序类参数配置 故障类型 故障模式 设置参数 进程 杀进程 process 进程持续异常,即使重新拉起也会被再次杀掉 process Java程序类 表2 Java程序类参数配置 故障类型 故障模式 设置参数 Java进程 Java进程内存溢出
复制LINUX命令,登录到主机中去执行。 代理接入可参考《应用运维管理AOM用户指南》的“代理区域管理”章节。 直连接入(公网) 云下主机,或非华为云主机,以及跨region接入的华为云主机也可以采用此方式接入。 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用。
合,包括了流量入口、多活分区、数据同步、数据监控等内容。用户可以创建多个命名空间,用于逻辑隔离不同的资源。一般推荐按照企业的系统划分,比如OA系统,支付系统等可以各建一个命名空间。 实例 MAS向用户提供服务的最小资源单位。 购买一个多活管理中心即创建一个多活实例,多活实例是一个
同城多活:多活业务中各多活子信息系统均处于同一地理区域,建议物理距离<50KM。 异地多活(规划中,暂不可选):多活业务中至少一个多活子信息系统与其他子系统处于不同地理区域,建议物理距离>300KM。 异地容灾:多活业务中至少一个多活子信息系统与其他子系统处于不同地理区域,建议物理距离>300KM。
配额说明 配额是指您在MAS系统中可创建的资源数量限制,具体的资源配额限制如表4-1 MAS配额规格所示。 表1 MAS配额规格 资源名称 配额(个) 备注 命名空间 10 系统支持的命名空间数量。 多活管理中心 10 系统支持的多活实例数量。 应用 200 单个实例支持的应用数量。
在使用边缘版多活实例前,需要准备虚拟机资源、安装Docker、挂载磁盘,以及检查虚拟机与MAS侧的端口是否连通。 虚拟机资源准备有以下两种场景,您可以根据实际场景准备虚拟机资源。 首次创建多活实例,需要根据MAS实例资源要求申请新的虚拟机。 在已创建过多活实例且实例已删除的虚拟机上重新创建多活实例。
主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
UniAgent接入ECS 本章节指导您将UniAgent接入ECS。 远程安装步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用。 单击右上角的“UniAgent安装”,进入UniAgent安装页面。 选择“弹性云服务器 ECS”。
创建故障演练 故障演练是一种通过注入大规模的体系化故障来模拟各类真实的系统故障,从而验证系统可靠性和技术团队应急响应能力的工程实践。 创建演练 登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练
某个时间段的使用量和计费信息。 账单上报周期 包年/包月计费模式的资源完成支付后,会实时上报一条账单到计费系统进行结算。 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,具体扣费规则可以参考按需产品周期结算说明。
查看实验报告 混沌实验/组报告提供详细的实验评估报告,涵盖执行结果、PerfTest背景流量业务指标以及AOM系统资源监控信息。 故障演练报告提供整体的和应用维度的故障注入、故障感知、故障定界、业务恢复等演练数据。 查看实验报告 登录MAS控制台。 单击“混沌工程>实验报告”,进入“实验报告”页面。
egion通过VPN网络纳管新加坡国际站的资源;从上海1通过专线纳管线下私有云接入进来的资源;从北京4通过公网IP纳管其他云厂商平台上的虚拟机资源。 创建应用-当资源类型选择为主机 登录MAS控制台。 单击“混沌工程>应用管理”,进入“应用管理”页面。 单击右上角的“创建应用”。
创建应用-当资源类型选择为自建K8S 在纳管自建K8S之前,需要先创建一个纳管资源为ECS的应用,此ECS作为集群控制节点。 纳管集群控制节点。 选择一台ECS作为集群控制节点,该ECS需要能够通过ip地址访问集群,以下以ecs-cast-vpn这台机器为例。将集群的连接信息按K8S标准格式填入
探针接入ECS 本章节指导您将探针接入ECS。 操作步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管ECS资源。 选择“弹性云服务器 ECS”页签。 单击操作列“安装探针”。 待探针状态显示运行中,则安装完成。
主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
应用场景 本次商城应用改造是基于github上50k+star的mall后台管理系统及对应前端项目进行改造来对接SDK。 后端项目地址:https://github.com/macrozheng/mall 前端项目地址:https://github.com/macrozheng/mall-admin-web
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“事件监控”,进入“事件监控”页面。 在“事件监控”页面,默认展示近24小时的所有系统事件与自定义事件。 单击具体事件右侧的操作列的“查看监控图表”,可查看具体事件的监控图表。 父主题: 事件监控
探针接入跨云IDC-主机 本章节指导您将探针接入跨云IDC-主机。 操作步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管跨云IDC-主机资源。 选择“跨云IDC-主机”页签。 单击操作列“安装探针”。
创建应用 应用韧性Hub通过应用来管理应用内云服务器资源及关联关系。 登录MAS控制台。 单击“应用韧性Hub>应用”,进入“应用”页面。 单击右上角的“创建应用”。 配置应用基本信息。 表1 应用基本配置 参数 配置说明 名称 自定义应用名称。 描述 填写对该应用的描述内容,选填项。
构建高可用性系统的需求。 软件开发工具包(SDK):SDK 的全称是 Software Development Kit,是一种被用来辅助开发某类软件而编写的特定软件包。 RPO(Recovery Point Objective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量。