检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
软件系统类故障 应用程序类 表1 应用程序类参数配置 故障类型 故障模式 设置参数 进程 杀进程 process 进程持续异常,即使重新拉起也会被再次杀掉 process Java程序类 表2 Java程序类参数配置 故障类型 故障模式 设置参数 Java进程 Java进程内存溢出
主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
区、数据同步、数据监控等内容。用户可以创建多个命名空间,用于逻辑隔离不同的资源。一般推荐按照企业的系统划分,比如OA系统,支付系统等可以各建一个命名空间。 实例 MAS向用户提供服务的最小资源单位。 购买一个多活管理中心即创建一个多活实例,多活实例是一个独立的资源空间,所有的操作
数据、日志上传出现偏差。您可以选择合适的NTP服务器进行时间同步,从而保持时间一致。配置方法可参考如何同步NTP服务器中的操作步骤。 安装增熵软件确保系统可以快速生成安全随机数。 根据操作系统类型安装并启动增熵软件。 euleros和centos可参考以下方法安装haveged进行增熵:
概述 云审计服务(Cloud Trace Service,CTS)可以记录MAS相关的操作事件,用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 开通了云审计服务后,系统开始记录MAS资源的操作。云审计服务管理控制台保存最近7天的操作记录。 开通云审计服务 云审计服务的开通请参见开通云审计服务。
什么是多活高可用服务 企业在应用发展的过程中会面临诸多难题,如: 使用单个AZ/Region无法满足高可靠诉求; 系统容量达到瓶颈或者访问时延无法达到要求; 云厂商技术绑定,无法获得先进技术和价格优势; 业务爆炸式增长带来的技术瓶颈。 多活高可用服务(Multi-Site High
选择多活类型。 同城多活:业务系统分布在同一地理区域的多个站点,多个站点同时对外提供服务。因为站点间物理距离较小,因此时延在业务可接受范围,通常物理时延<2ms。 异地多活(规划中,暂不可选):业务系统分布在不同地理区域的多个站点,多个站点同时对外提供服务。因为站点间物理距离较大,业
某个时间段的使用量和计费信息。 账单上报周期 包年/包月计费模式的资源完成支付后,会实时上报一条账单到计费系统进行结算。 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,具体扣费规则可以参考按需产品周期结算说明。
ReadOnlyAccess 多活高可用服务只读权限,拥有该权限的用户仅能查看多活高可用服务数据。 系统策略 无 表2列出了MAS常用操作与系统策略的授权关系,您可以参照该表选择合适的系统策略。 表2 常用操作与系统策略的关系 操作 MAS FullAccess MAS CommonOperations
MAS自定义策略 如果系统预置的MAS权限,不满足您的授权要求,可以创建自定义策略。目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以
本章节指导用户查看事件监控的监控数据。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“事件监控”,进入“事件监控”页面。 在“事件监控”页面,默认展示近24小时的所有系统事件与自定义事件。 单击具体事件右侧的操作列的“查看监控图表”,可查看具体事件的监控图表。
对于包年/包月计费模式的MAS实例,用户在购买时会一次性付费,服务将在到期后自动停止使用。 如果在计费周期内不再使用包年/包月资源,您可以执行退订操作,系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。 如果您已开启“自动续费
如果显示ErrImagePull,说明当前集群的机器无法拉取默认镜像,此时需要手动将镜像下载后上传到能够拉取的镜像仓。下文以北京四纳管自建K8S为例: 进入创建应用-纳管自建K8S界面,找到镜像地址,根据集群为x86或是arm机器,单击按钮复制拉取镜像命令。 此处以x86机器为例,执行 docker pull swr
多的冗余成本,提高了统一的资源利用率,同时降低成本。 异地多活 多活业务中至少一个多活子信息系统与其他子系统处于不同地理区域,建议物理距离>300KM。 业务连续性:跨地域容灾&多活,系统容量翻倍,对外SLA极大提升。 管理一致: 两个数据中心架构一致,管理操作一致,多活管控一致。
查看实验报告 混沌实验报告和混沌实验组报告提供详细的实验评估报告,涵盖执行结果、PerfTest背景流量业务指标以及AOM系统资源监控信息。 故障演练报告提供整体的和应用维度的故障注入、故障感知、故障定界、业务恢复等演练数据。 查看实验报告 登录MAS控制台。 单击“混沌工程>实验报告”,进入“实验报告”页面。
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“事件监控”,进入“事件监控”页面。 在事件列表页面,单击页面右上角的“创建告警规则”。 根据界面提示,配置告警规则名称、告警策略、告警通知等参数,其中: 告警类型:选择“指标”或“事件”。 事件类型:选择“系统事件”。 事件来源:选择“MAS”。
配额说明 配额是指您在MAS系统中可创建的资源数量限制,具体的资源配额限制如表4-1 MAS配额规格所示。 表1 MAS配额规格 资源名称 配额(个) 备注 命名空间 10 系统支持的命名空间数量。 多活管理中心 10 系统支持的多活实例数量。 应用 200 单个实例支持的应用数量。
创建故障演练 故障演练是一种通过注入大规模的体系化故障来模拟各类真实的系统故障,从而验证系统可靠性和技术团队应急响应能力的工程实践。 创建演练 登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练
应用场景 本次商城应用改造是基于github上50k+star的mall后台管理系统及对应前端项目进行改造来对接SDK。 后端项目地址:https://github.com/macrozheng/mall 前端项目地址:https://github.com/macrozheng/mall-admin-web
化场景。 分区化管理+应用数据多活,可扩展性强,可以随时增加新的分区,可靠性高。 场景五:混沌工程 适用于向被测系统主动引入故障,通过故障注入、故障演练的方式提升系统可靠性。 图1 MAS应用场景