检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据命名规则,自定义演练任务的名称。 期望恢复时长(分钟) 3 从故障发生到故障恢复的预期时间 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。 图5 “添加新的攻击任务”参数配置
执行记录 脚本工单 作业工单 补丁工单 资源操作工单 父主题: 任务管理
自动化运维 补丁管理 脚本管理 作业管理 定时运维 账号管理 参数中心
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的创建配置、删除、编辑修改、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。
在“日常运维”模块单击“补丁管理”。 在“补丁扫描”页签,选择需要创建的资源类型。 默认选择“弹性云服务器ECS”。 单击“创建扫描任务”。 设置“基础信息”。 执行用户:默认“root”,不可更改。 超时时间:用于限制扫描允许执行的最长时间。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明
String CMDB分配的资源ID resource_id String 云服务分配的资源ID name String 资源名称 provider String 云服务名称 type String 资源类型 project_id String Openstack中的项目I region_id
演练任务功能允许用户通过模拟软件或硬件故障来测试系统的恢复能力。演练任务操作包括管理混沌演练任务和查看演练记录,以及创建演练任务的流程。演练任务的设置包括基础信息、攻击任务组的添加、攻击任务的选择、攻击场景的选择等。此外,演练任务还涉及监控任务配置,以及演练后的复盘改进,确保系统在各种压力下的表现行为能够确定优化策略。
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
可选参数。对设备进行描述。 - 表5 虚拟机参数说明 参数名称 说明 示例 设备名称 自定义设备的名称。 测试设备 私有IP 虚拟机私有IP。 192.168.1.1 操作系统 在下拉列表选择操作系统。 LINUX UniAgent Id 可选参数。UniAgent唯一标识。 - Ecs Id 可选参数。Openstack生成的唯一标识。
可选参数。用户授权云运维中心执行作业所能够使用的权限范围。 ServiceLinkedAgencyForCOC 执行描述 可选参数。对本次作业进行执行描述。 - 标签 可选参数。单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
等场景。支持问题处理人挂起问题单,问题单挂起后默认需创建人审批,若需修改先审批流程,可参考流程管理。 挂起问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“挂起”。 设置“挂起”。 表1 挂起参数说明
故障信息参数说明 参数 说明 报告标题 自定义故障报告的标题。 报告责任人 在下拉列表选择故障报告责任人。 故障现象 请填写故障的现象。 限制长度1-1000个字符。 影响客户 请填写受影响的客户。 限制长度1-1000个字符。 影响应用 请填写应用的影响描述。 支持添加和删除影响应用。 设置“处理过程”。
入群组的人加入到warroom会议和创建的移动应用中。 修改起会规则 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”。 选择需要修改的起会规则,单击操作列“修改”。 设置“修改起会规则”。 表2 修改起会规则参数说明 参数 说明 规则名称 自定义规则名称。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
单击“立即开通”,填写对应的企业微信应用id、企业密钥、通讯录密钥,钉钉和飞书同理。 单击“完成”,当右上角出现“创建移动应用成功”时,即成功创建。 图2 创建移动应用 修改移动应用密钥 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。 单击“修改密钥”,填写对应的企业密钥、通讯录密钥,钉钉和飞书同理。
通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。 使用应用诊断检查故障恢复情况和应用状态,故障恢复后需在修改故障信息填写故障基本信息。 关闭WarRoom
> 流程管理”页面,单击页面问题流程>问题级别。 图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程
通知管理”页面,选择需要编辑的通知,在列表中的“操作”列单击对应的“编辑”,参考创建通知的步骤3进行编辑和保存。 图3 编辑通知 删除通知 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,选择需要删除的通知,在列表中的“操作”列单击对应的“删除”, 图4 删除通知
完成与会成员添加。 设置成员角色 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击与会成员右侧。 选择需要修改的用户,单击用户右侧。 设置成员角色。 表2 成员角色说明 成员角色 说明 管理员 可以将管理员移交给其他无角色