检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 企业项目 故障模式资源所属的企业项目,默认为default 所属应用 演练目标所属的应用 事件级别评估 参考事件中心事件级别定义
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值
混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。
数名称、默认值和参数描述;从参数仓库获取时需要选择参数所在区域、参数名称和参数联动模式。 图6 选择自定义并添加全局参数 图7 从参数仓库获取并添加全局参数 表1 参数联动模式说明表 参数联动模式 说明 所有环境使用当前参数值 作业执行时使用该参数,参数值为创建作业添加参数时该参数基本信息中显示的参数值
在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 所属应用 演练目标所属的应用 事件级别评估 参考事件中心
供创建待办、定时运维、通知管理、事件中心等多个基础功能模块使用。 排班管理:为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。 通知管理:为用户创建通知实例,通知实例包含通知场景及匹配规则条件等,当满足规则触发条件时向指定人员发送消息,实现了自动通知的功能。 人员管理
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
手动输入时需要用自行填写参数值;从参数中心选择时,需要选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
变更中心 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 核心能力:当前支持变更管理、变更配置等能力。 创建变更单 父主题: 变更管理
填写执行基本信息,包含执行描述和标签。可按照标签管理中的步骤创建标签。 图3 填写执行基本信息 选择公共作业执行的“目标实例模式”,分为“所有步骤一致”和“每个步骤独立”两种。 表1 目标实例模式说明 目标 说明 所有步骤一致 所有步骤在所有目标实例执行 每个步骤独立 自定义配置,可选择指定步骤仅在指定目标实例执行
端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。 故障模式库:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,用户开箱即用。 图5 智能化混沌演练
靠。 标准化故障管理,加持WarRoom作战驾驶舱,实现故障高效协同和快速恢复。 智能化混沌演练,全旅程混沌工程解决方案,颠覆传统被动运维模式,推动客户向主动运维变革。 父主题: 使用前必读
排班管理概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规
填写执行基本信息,包含执行描述和标签。可按照标签管理中的步骤创建标签。 图11 填写执行基本信息 选择作业在目标实例的执行模式,分为“所有步骤一致”和“每个步骤独立”两种。 表1 目标实例模式说明 目标 说明 所有步骤一致 本作业涉及的所有步骤将按顺序在目标实例执行 每个步骤独立 自定义配置,配置时可选择指定步骤仅在指定目标实例执行