检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 所属应用 演练目标所属的应用 事件级别评估 参考事件中心
故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 企业项目 故障模式资源所属的企业项目,默认为default 所属应用 演练目标所属的应用 事件级别评估 参考事件中心事件级别定义
检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情 所有用户可查看系统预置的公共SLA。 启用/禁用公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面,选择“公共SLA”页签,进入公共SLA界面。 选择列表中的SLA数
号基线来纳管主机。 图2 基线信息录入 主机的某个帐号能被成功纳管有三个前提条件: 1、安装UniAgent且UniAgent的状态为运行中。 2、主机状态为运行中。 3、主机中存在基线中配置的帐号且帐号可登录。 为了确保组件下新增的主机实例能被自动纳管,还需在“帐号改密”->“
种。 表1 目标实例模式说明 目标 说明 所有步骤一致 所有步骤在所有目标实例执行 每个步骤独立 自定义配置,可选择指定步骤仅在指定目标实例执行 图4 选择所有步骤一致 图5 选择每个步骤独立 单击“+添加实例”,选择待执行实例的区域,根据实例名称、UniAgent状态等条件筛选并选中目标实例,单击“提交”。
选择作业在目标实例的执行模式,分为“所有步骤一致”和“每个步骤独立”两种。 表1 目标实例模式说明 目标 说明 所有步骤一致 本作业涉及的所有步骤将按顺序在目标实例执行 每个步骤独立 自定义配置,配置时可选择指定步骤仅在指定目标实例执行 图12 选择所有步骤一致 图13 选择每个步骤独立
单击“+添加参数”,添加全局参数,配置后单击“完成”。 全局参数支持自定义、从参数仓库获取两种。选择自定义时需要自行填写参数名称、默认值和参数描述;从参数仓库获取时需要选择参数所在区域、参数名称和参数联动模式。 图6 选择自定义并添加全局参数 图7 从参数仓库获取并添加全局参数 表1 参数联动模式说明表 参数联动模式
通过预案自动化帮助客户处理确定性问题,实现已知问题快速恢复。 故障模式:融合专业风险分析方法和专家知识库,积累故障模式库,帮助客户分析云应用存在的潜在风险、传承运维经验。 韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的风险治理,贯穿应用和资源全生命周期,将华为云多年沉淀的动态清零风险管理经验使能用户。
应用排班+固定班次场景添加排班人员 应用排班+轮班场景添加排班人员 全局排班+固定班次场景 使用场景:适用所有应用,排班人员是全天固定。 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择已创建的排班场景(排班场景名称后面会显示“全局排班+固定班次”)及排班角色,单击“添加人员”添加排班人员。
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值
步骤二:安装UniAgent 在“资源管理”页面,勾选目标弹性云服务器,选择“UniAgent>安装”,进入安装UniAgent页面。 图2 安装UniAgent 单击 “手动安装”,进入手动安装UniAgent页面。 图3 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
设置“应用结构类型”。 图2 “应用结构类型”参数配置 表1 “应用结构类型”参数说明 参数 示例 说明 应用结构类型 轻量级应用 请根据应用结构的复杂类型选择。 设置“应用结构配置”。 图3 “应用结构配置”参数配置 表2 “应用结构配置”参数说明 参数 示例 说明 应用名称 test-application
流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多监控源纵向抑制、横向收敛,进行多维降噪;支持每个流转规则配置事件时默认分配对象和通知策略,而实现更准确的通知。 Global 集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控
手动输入时需要用自行填写参数值;从参数中心选择时,需要选择参数所在区域、参数名称和参数联动模式。 图2 手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值
务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
本文介绍如何使用人员管理模块。 添加用户操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员 编辑用户信息操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,选择需要编辑的人员在对应行“操作”列单击“编辑”。 图2
不通知 单击“确定”对SLA规则进行修改。 图7 配置SLA规则 生效时间默认选择“7天*24小时”,SLA将在任何时间生效。当选择“其他”按钮时,弹出时间选项,可自定义勾选每周的生效日期和设置生效时段。 图8 设置生效时间 当所有SLA信息都填好后,单击“提交”,即可成功创建自定义SLA。
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规则、事件中心、自动化运维