检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
软件系统类故障 应用程序类 表1 应用程序类参数配置 故障类型 故障模式 设置参数 进程 杀进程 process 进程持续异常,即使重新拉起也会被再次杀掉 process Java程序类 表2 Java程序类参数配置 故障类型 故障模式 设置参数 Java进程 Java进程内存溢出
多活容灾方案对网络是不是也有要求?否则网络不稳定很差或网络抖动场景下,是不是会存在误切现象? 同region多AZ情况下,配置是多份还是一份? MAS APIG在当前用户方案中是两边都部署吗?还是只在华为侧部署,再指向第三方云的网关?
合适的NTP服务器进行时间同步,从而保持时间一致。配置方法可参考如何同步NTP服务器中的操作步骤。 安装增熵软件确保系统可以快速生成安全随机数。 根据操作系统类型安装并启动增熵软件。 euleros和centos可参考以下方法安装haveged进行增熵: yum install -y
单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管CCE资源。 选择“云容器引擎 CCE”页签。 单击操作列“安装探针”。 待探针状态显示运行中,则安装完成。 父主题: 故障注入探针
单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管ECS资源。 选择“弹性云服务器 ECS”页签。 单击操作列“安装探针”。 待探针状态显示运行中,则安装完成。 父主题: 故障注入探针
在页面顶端导航栏选择“应用列表”,单击页面左上角的“新增应用”。 在新增应用弹窗填写应用信息,完成后单击“确定”。 图1 新增应用 表1 应用配置信息 参数 配置说明 应用名称 自定义应用名称。 描述 填写对该应用的描述内容,选填项。 应用监控器切换 创建完应用并给应用创建监控器后,可对应用
表1 服务器硬件类参数配置 故障类型 故障模式 设置参数 CPU CPU过载 usage 内存 内存过载 usage 磁盘 磁盘分区满 disk;usage 磁盘IO高 disk;usage 网卡 网卡down dev_name 网络通信类 表2 网络通信类参数配置 故障类型 故障模式
由于混沌工程是使用uniagent来执行脚本的,获取自建k8s机器信息和注入故障都需要在主机上执行相关命令,uniagent在执行脚本前会加载用户的环境变量配置,会执行 source /etc/bashrc这个命令,由于主机上的这个文件有错误,就会导致执行的时候产生错误流。影响脚本的真实结果,导致出现这个问题。
单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管跨云IDC-主机资源。 选择“跨云IDC-主机”页签。 单击操作列“安装探针”。 待探针状态显示运行中,则安装完成。 父主题: 故障注入探针
在“我的应用”栏下选择所需安装的应用,该应用已纳管自建K8S资源。 选择“云服务-自建K8S”页签。 单击操作列“安装探针”。 等待探针状态从“部署中”变成“运行中”,说明安装完成。部署可能持续0~10分钟。 如果探针状态显示“部署失败”,很可能是镜像无法拉取,这时需要手动去安装kubectl工具的机器上确认结果。
批量续费:在资源页面勾选需要续费的资源(可同时勾选多个实例),单击列表左上角的“批量续费”。 选择实例的续费时长,判断是否勾选“统一到期日”。确认配置费用后单击“去支付”。 将实例到期时间统一到每个月的某一天的详细介绍请参见统一包年/包月资源的到期日。 进入支付页面,选择支付方式,确认付款,支付订单后即可完成续费。
内容;也可以直接在编辑框内编写JSON格式的策略内容。 以下为常用的MAS自定义策略样例。 “可视化视图导航栏”选择步骤可参考《可视化视图配置自定义策略》。 MAS自定义策略样例 示例1:授权用户创建、修改和查看实例的权限。 { "Version": "1.1",
开通自动续费后,还可以手动续费该实例。手动续费后,自动续费仍然有效,在新的到期时间前的第7天开始扣款。 自动续费的到期前7日自动扣款属于系统默认配置,您也可以根据需要修改此扣款日,如到期前6日、到期前5日等等。 更多关于自动续费的规则介绍请参见自动续费规则说明 。 前提条件 请确认包年/包月的实例还未到期。
在实例到期前均可开通自动续费,到期前7日凌晨3:00首次尝试自动续费,如果扣款失败,每天凌晨3:00尝试一次,直至实例到期或者续费成功。到期前7日自动续费扣款是系统默认配置,您也可以根据需要修改此扣款日。 父主题: 续费
可以对应用进行添加云服务资源、同步云服务资源、修改资源分组、删除云服务资源等操作。 评估管理 展示该应用当前的评估策略,可以对应用的评估配置信息进行编辑。 支持对应用的应用类型、评估项进行修改,同时支持是否开启每日评估以及RTO/RPO评估,同时支持对RTO/RPO评估的目标值进行调整。
登录MAS控制台。 单击“混沌工程>故障演练”,进入“故障演练”页面。 单击右上角的“创建演练”,进入“创建演练”页面。 图1 创建演练 配置基本信息,输入演练名称和描述(可选)。 关联混沌实验/实验组。 单击“选择”,在弹窗中选择所需关联的混沌实验/实验组,并单击“确定”。 一
应用概述 应用对租户下的云服务资源按照应用维度进行统一纳管。 故障注入前需先创建应用,纳管资源后再为应用中的资源安装UniAgent和探针。 混沌工程目前是region级服务,按照资源是否在当前region,应用可按照云服务和跨云跨IDC两个类别分别进行纳管。 父主题: 创建应用
应用韧性Hub(Application Resilience Hub)基于华为内部IT最佳实践经验, 结合业界公有云方案,从应用可靠性角度, 帮助用户分析华为云云上资源部署情况,识别风险点并给出建议, 提升云上业务的稳定性。 应用韧性主要包括如下功能点: 描述应用:描述客户应用架构,涵盖应用内云服务器资源及关联关系;支持租户授权评估。
混沌工程 混沌工程概述 故障模式库 创建应用 安装探针 创建混沌实验 创建混沌实验组 故障场景库 创建故障演练 查看执行记录 查看实验报告
如果您需要提高应用的高可用性,建议您将多活实例创建在不同的可用区内;如果您需要较低的网络时延,建议您将多活实例创建在相同的可用区内;可用区选择请与业务部署架构保持一致。 企业项目 企业项目管理提供了一种按企业项目管理云资源的方式,帮助用户实现以企业项目为基本单元的资源及人员的统一管理。 应用