检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
混沌演练”页面,选择“ 故障模式”页签,单击“创建故障模式”。 图1 故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称。 企业项目 故障模式资源所属的企业项目,默认为default。
作业名称 根据命名规则,自定义作业的名称。 测试作业 企业项目 在下拉列表中选择企业项目。 default 描述 对作业进行描述。 - 标签 可选参数。单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接,需要用户自行修改解释器,适配为机器可执行的解释器。 校验高危命令:可对脚本内容进行高危检测。 校验范围:检测涉及的高危命令范围,可点击“高危命令说明”查看校验的规则列表。
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 所属应用 演练目标所属的应用 事件级别评估 参考事件中心 来源 包括主动分析,已有故障
可选参数。用户授权云运维中心执行作业所能够使用的权限范围。 ServiceLinkedAgencyForCOC 执行描述 可选参数。对本次作业进行执行描述。 - 标签 可选参数。单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_
演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
根据命名规则,自定义演练任务的名称。 期望恢复时长(分钟) 3 从故障发生到故障恢复的预期时间 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。 图5 “添加新的攻击任务”参数配置
“Python”、“Bat”三种命令,支持全局参数和关联参数仓库。 脚本内容大小限制1M。 单个租户账号下所有子账号最多支持创建200个脚本。 公共脚本 公共脚本是由云运维中心提供几种常见运维场景的解决方案,脚本详情所有用户可见,公共脚本不支持用户的增加、修改和删除。 父主题: 脚本管理
注意选择参数所在区域、参数名称和参数联动模式。 图1 手动输入脚本参数 图2 参数仓库选择脚本参数 表1 参数联动模式说明 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值。 若脚本入参设置方式需选择“参数仓库”,请提前在本服务左侧菜单“参数管理
变更管理主要为构建运维作业全生命周期的安全生产能力,降低变更风险,主要承载变更流程管理业务。包含变更日历、变更中心、变更配置、变更管控等能力。 变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、
true:表示演练处于取消正在注入故障的阶段时,会执行rollback()回滚函数中的内容 false:表示演练处于取消正在注入故障的阶段时,不会执行rollback()回滚函数 1. 在"inject_fault"函数中,请添加一个故障注入成功的标志,并于"check_fault_
补丁扫描 操作场景 您可以通过补丁扫描功能扫描目标实例补丁的合规性,补丁扫描会根据您选择的默认基线、实例、分批执行策略进行扫描。扫描后的扫描结果展示实例补丁的合规状态。 注意事项 若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常。 是否为Cloud Operations
排班管理中可以设置多种排班,一个排班场景即是一种排班的集合。创建排班场景时,您需要选择对应的排班方式,排班维度。根据您的选择,后续设置排班的方式也会有所区别。 场景角色概述 场景角色是设置排班时的最小单位,一个排班场景中可以创建多个排班角色,在设置排班时可以对每个角色设置不同的值班人。 父主题: 排班管理
注意选择参数所在区域、参数名称和参数联动模式。 图1 手动输入脚本参数 图2 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值 设置“执行用户”和“超时时间”。 执行
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
补丁基线支持用户自定义配置。用户可通过所设置的补丁基线对实例的补丁进行扫描,修复不符合基线的补丁。 补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器E