检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称。 企业项目 故障模式资源所属的企业项目,默认为default。 所属应用 演练目标所属的应用。 事件级别评估 参考事件中心事件级别定义。 来源
混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
自定义故障 操作场景 创建故障模式,可以针对潜在的故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器
满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
设置“区域”、“目标实例模式”和“作业步骤”。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。 所有步骤一致:所有步骤在所有目标实例执行。 每个步骤独立:可独立设置每个作业步骤执行的目标实例和分批策略。 每个任务独立:可独立设置每个作业任务执行的目标实例和分批策略。
(可选)设置“全局参数”。 全局参数:全局参数支持“自定义”和“参数仓库”两种方式。“自定义”方式需要用自行填写参数值;“参数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 表3 参数联动模式说明 参数联动模式 说明 所有环境使用当前参数值 作业执行时
持“手动输入”和“参数仓库”两种方式。“手动输入”方式需要用自行填写参数值;“参数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 图1 手动输入脚本参数 图2 参数仓库选择脚本参数 表1 参数联动模式说明 参数联动模式 说明 使用对应环境最新参数值
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查
步骤一:故障模式 确认演练目标主机或容器所属应用,事件级别是否正确。 登录COC。 在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名
“手动输入”和“参数仓库”(清理磁盘暂不支持)两种方式。“手动输入”方式需要用自行填写参数值;“参数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 图1 手动输入脚本参数 图2 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式
变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 变更配置:承载变更中心相关配置的业务,支持审
户处理确定性问题,实现已知问题快速恢复。 故障模式:融合专业风险分析方法和专家知识库,积累故障模式库,帮助客户分析云应用存在的潜在风险、传承运维经验。 韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的风险治理,贯穿应用和资源全生命周期,将华为云多年沉淀的动态清零风险管理经验使能用户。
概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规则、事件
变更风控&作业可信,融合华为SRE安全生产最佳实践的变更管控模型,助力客户作业可信和稳定可靠。 标准化故障管理,加持WarRoom作战驾驶舱,实现故障高效协同和快速恢复。 智能化混沌演练,全旅程混沌工程解决方案,颠覆传统被动运维模式,推动客户向主动运维变革。 父主题: 使用前必读