检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。
选择资源类型为主机,单击“添加”。 输入“主机名”、“IP”,单击“下一步”。 请正确录入远程主机的主机名(可通过hostname命令查询)和私有IP。录入非私有IP会导致UniAgent安装之后状态查询失败。 确认配置无误后,单击“提交”,完成应用创建。 创建应用-当资源类型选择为自建K8S 在纳管自建K8
MAS自定义策略 如果系统预置的MAS权限,不满足您的授权要求,可以创建自定义策略。目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以
#etcd地址,从MAS服务实例页面查询获取 api-version: v3 #etcd版本,v3 username: etcduser #etcd用户名,从MAS服务实例页面查询获取 password: etcdpwd #etcd密码,从MAS服务实例页面查询获取
自动续费的到期前7日自动扣款属于系统默认配置,您也可以根据需要修改此扣款日,如到期前6日、到期前5日等等。 更多关于自动续费的规则介绍请参见自动续费规则说明 。 前提条件 请确认包年/包月的实例还未到期。 在续费管理页面开通自动续费 进入“费用中心 > 续费管理”页面 自定义查询条件。例如,选择“产品类型”为“多活高可用服务”。
中国-香港 查看事件监控图表 创建事件监控告警规则 事件监控支持的事件说明 查看审计日志 云审计服务(Cloud Trace Service,CTS)可以记录MAS相关的操作事件,用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。开通了云审计服务后,系统开始记录MAS资源的操作。
故障模式库 查看故障模式 基础设施类故障 软件系统类故障 容器类故障 Kubernetes集群 云服务故障 父主题: 混沌工程
STATUS PORTS NAMES 磁盘挂载 以下操作需在每台虚拟机上都执行。 以root用户登录待挂载虚拟机。 查看磁盘情况。 fdisk -l 系统显示如下信息,表示系统有一个空间为500G的磁盘,盘符为/dev/vdb,请将磁盘/dev/vdb挂载到/opt/cloud/mas目录。
云审计服务(Cloud Trace Service,简称CTS)提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 开通了云审计服务后,系统开始记录MAS资源的操作。审计服务管理控制台保存最近7天的操作记录。
Server进行命名空间、工作负载等参数的查询,并通过下拉框的方式提供给用户选择。 单击“高级配置”页签,进行高级配置。相关参数可参考创建混沌实验的设置高级配置。 配置完成后单击“保存”,即可生成混沌实验组。单击“混沌实验组”菜单,可以对新创建出来的实验组进行查看、编辑、执行等操作。 父主题:
凭证管理 概述 MAS支持纳管华为云内多账号资源,基于IAM委托或AOM访问密钥( AK/SK)创建凭证,通过使用凭证实现当前账号查询、调用其他账号资源。 创建凭证 登录MAS控制台,在“凭证管理”页面单击“创建凭证”。 在“创建凭证”弹窗,填写配置信息。 图1 创建凭证 表1 凭证参数配置
务中如何查询。 etcd.apiVersion填写固定值V3。 etcd.httpsEnable的值取决于ETCD页面“etcd集群地址”访问是http,这里值为false;访问是https,这里值为true。查看方法参考props、etcd配置项在MAS服务中如何查询。 表3 sources数据源配置项
应用场景 本次商城应用改造是基于github上50k+star的mall后台管理系统及对应前端项目进行改造来对接SDK。 后端项目地址:https://github.com/macrozheng/mall 前端项目地址:https://github.com/macrozheng/mall-admin-web
故障切换演练 查看监控器活跃的数据中心。 登录MAS控制台,在“多活管理”页面单击多活实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,查看创建的“litemall-db”MySQL监控器。 在未出现故障前,监控器的活跃数据中心为数据中心1,即主数据中心,此时商城应用是连接数据中心1。
构建高可用性系统的需求。 软件开发工具包(SDK):SDK 的全称是 Software Development Kit,是一种被用来辅助开发某类软件而编写的特定软件包。 RPO(Recovery Point Objective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量。
在事件列表页面,单击页面右上角的“创建告警规则”。 根据界面提示,配置告警规则名称、告警策略、告警通知等参数,其中: 告警类型:选择“指标”或“事件”。 事件类型:选择“系统事件”。 事件来源:选择“MAS”。 图1 创建告警规则 其他参数请参考创建事件监控的告警通知,告警规则创建完成后,当事件监控指标触发设定
appId: xxx // 应用ID,从MAS服务实例页面查询获取 monitorId: xxx // 监控器ID,从MAS服务实例页面查询获取 databaseName: xxx // 数据库名,从MAS服务实例页面查询获取 decipherClassName: xxx
#etcd地址,从MAS服务实例页面查询获取 api-version: v3 #etcd版本,v3 username: etcduser #etcd用户名,从MAS服务实例页面查询获取 password: etcdpwd #etcd密码,从MAS服务实例页面查询获取
appId: xxx // 应用ID,从MAS服务实例页面查询获取 monitorId: xxx // 监控器ID,从MAS服务实例页面查询获取 databaseName: xxx // 数据库名,从MAS服务实例页面查询获取 decipherClassName: xxx
化场景。 分区化管理+应用数据多活,可扩展性强,可以随时增加新的分区,可靠性高。 场景五:混沌工程 适用于向被测系统主动引入故障,通过故障注入、故障演练的方式提升系统可靠性。 图1 MAS应用场景