检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 企业项目 故障模式资源所属的企业项目,默认为default 所属应用 演练目标所属的应用 事件级别评估 参考事件中心事件级别定义
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 所属应用 演练目标所属的应用 事件级别评估 参考事件中心 来源 包括主动分析,已有故障 应急预案名称
代理区域是对代理机的分类管理;代理机是指在华为云购买和配置一台华为云弹性云服务器ECS,为解决多云之间网络互通。 - 安装机 安装机是远程安装方式下命令的执行机,必选项。 如果没有配置安装机,按如下步骤进行配置: 单击对应的下拉框,选择“设置安装机”。 进入AOM服务进行安装机配置。 - 需安装UniAgent主机
代理区域是对代理机的分类管理;代理机是指在华为云购买和配置一台华为云ECS弹性云服务器,为解决多云之间网络互通。 - 安装机 安装机是远程安装方式下命令的执行机,必选项。 如果没有配置安装机,按如下步骤进行配置: 单击对应的下拉框,选择“设置安装机”。 进入AOM服务进行安装机配置。 - 需安装UniAgent主机
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值 若脚本入参设置方式需选择“参数仓库”,请提前在本服务左侧菜单“参数管理
Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器ECS和裸金属服务器BMS)执行操作。 本章节介绍
操作场景 通过Cloud Operations Center查看资源拓扑关系。 注意事项 目前仅支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)以上四种资源的拓扑关系。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理
Operations Center创建一个攻击场景为自定义故障的演练任务。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
补丁修复后合规性报告仍然为不合规如何处理? 单击修复后生成的合规性报告摘要 图1 合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启
问题标题:必填,简要填写问题描述 问题描述:必填,具体描述问题现网和对现网的影响,支持上传附件 问题来源:非必填,填写问题来源,来源包含事件、告警、WarRoom和主动运维发现。若是处理事件发现的问题则选择事件。 问题发生时间:非必填,填写当前问题发生的时间 问题应用:必填,选择该问题的归属应用 问题级别
标准化故障管理,加持WarRoom作战驾驶舱,实现故障高效协同和快速恢复。 智能化混沌演练,全旅程混沌工程解决方案,颠覆传统被动运维模式,推动客户向主动运维变革。 父主题: 使用前必读
复。 故障模式:融合专业风险分析方法和专家知识库,积累故障模式库,帮助客户分析云应用存在的潜在风险、传承运维经验。 韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的风险治理,贯穿应用和资源全生命周期,将华为云多年沉淀的动态清零风险管理经验使能用户。 使能主动运维:通过
管理员在权限管理-权限中,单击“创建自定义策略”。 图1 创建自定义策略 设置策略内容,选择允许“云服务操作中心”,并选择要进行企业项目鉴权的操作。单击“确定”完成创建。 图2 设置策略内容-1 图3 设置策略内容-2 图4 设置策略内容-3 云运维中心当前仅有部分操作支持按照企业项目授权,可以参考表1创建自定义策略。
(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识
任务”,进入添加攻击新的攻击任务页面。 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。 图5 “添加新的攻击任务”参数配置 表4 “添加新的攻击任务”参数说明 参数 示例 说明 攻击目标来源 弹性云服务器(ECS) 请选择目标实例的来源。 攻击任务名称
图1 点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。