检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 企业项目 故障模式资源所属的企业项目,默认为default 所属应用 演练目标所属的应用 事件级别评估 参考事件中心事件级别定义
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
根据实际需求修改参数,单击“提交”即可。 修改的通知时间若是相对时间,则需要注意以下事项: 未修改通知,通知时间会变成相对于修改的时间(单击修改参数按钮的时间)进行通知,只要单击了修改参数按钮,通知时间就会改变。 删除前通知,通知时间相对于删除时间,若修改删除时间,则会影响删除前通知时间。
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud Operations Center创建一个自定义故障攻击场景的演练任务。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,参考演练任务的步骤2-步骤6,新建攻击任务。
(CCE)攻击场景 如果选择攻击目标来源为云数据库(RDS),则选择指定的云数据库实例,单击“下一步”。 图10 选择攻击目标为云数据库(RDS) 选择云数据库(RDS)攻击场景并填写场景的攻击参数,单击“完成”即可。 图11 云数据库(RDS)攻击场景 如果选择攻击目标来源为分布式
手动输入时需要用自行填写参数值;从参数中心选择时,需要选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值
务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
云运维中心中的故障管理、资源运维等场景中,支持发送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库 资源运维中,可以对云数据库进行批量操作。混沌演练中,支持对云数据库进行演练任务执行。 资源运维 混沌演练 裸金属服务器 资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。
填写任务名称,操作描述。 图6 填写基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ListSlowLogsNew(查询数据库慢日志)OpenAPI,显示具体的OpenAPI定义。 填写所需OpenAPI参数内容。 图7 添加输入信息 单击
操作系统、重装操作系统等操作。 Global 批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 Global 批量FlexusL操作 批量FlexusL操作为用户提供了管理云耀云服务器L实例的能力,支持进行批量开机、关机、重启、重装操作系统等操作。
操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。
项目[所属区域] 使用场景 IAM ReadOnlyAccess 统一身份认证服务的只读权限 全局服务 [全局] 人员管理中读取IAM账户下的人员信息 RMS ReadOnlyAccess 资源管理服务只读权限 全局服务 [全局] 资源管理中同步纳管云服务资源 DCS UserAccess
支持响应预案:支持客户对已知故障制定响应预案,通过预案自动化帮助客户处理确定性问题,实现已知问题快速恢复。 故障模式:融合专业风险分析方法和专家知识库,积累故障模式库,帮助客户分析云应用存在的潜在风险、传承运维经验。 韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的
批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 批量开启 批量停止 批量重启 父主题: 资源运维
在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 所属应用 演练目标所属的应用 事件级别评估 参考事件中心
时,不需要切换区域。 如表2所示,包括了COC的所有系统权限。基于角色授权场景的系统策略与基于策略授权场景的并不互通。 表2 COC系统权限 系统角色/策略名称 描述 类别 依赖关系 COC ReadOnlyAccess 云运维中心服务只读权限 系统策略 无 COC FullAccess