检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“故障影响”模块,单击“新增影响应用”,弹出“新增影响应用”页面。 根据页面提示,设置新增的影响应用信息。 单击“确定”完成添加。 图1 新增影响应用 在主屏可以看到添加的应用,支持填写故障开始时间、恢复时间及故障描述。提交后该应用的状态会变为恢复状态。 受影响应用支持执行
(CCE)攻击场景 如果选择攻击目标来源为云数据库(RDS),则选择指定的云数据库实例,单击“下一步”。 图10 选择攻击目标为云数据库(RDS) 选择云数据库(RDS)攻击场景并填写场景的攻击参数,单击“完成”即可。 图11 云数据库(RDS)攻击场景 如果选择攻击目标来源为分布式
编辑账号 提供用户对已有的账号进行更新的能力。 操作场景 通过Cloud Operations Center更新云厂商账号。 操作步骤 登录COC。 在“多云配置”页面中单击接入列表中对应云厂商的所在行“操作”列中的“编辑”。 图1 编辑账号 填写信息,具体信息可参考 表1 ,单击“确认”。
班角色后单击“提交”。若已有排班场景和排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。 排班方式:排班的方式,可选择“固定班次”和“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。
根据实际需求修改参数,单击“提交”即可。 修改的通知时间若是相对时间,则需要注意以下事项: 未修改通知,通知时间会变成相对于修改的时间(单击修改参数按钮的时间)进行通知,只要单击了修改参数按钮,通知时间就会改变。 删除前通知,通知时间相对于删除时间,若修改删除时间,则会影响删除前通知时间。 父主题:
图22 查询列表 单击搜索框,弹出搜索条件列表;选择对应的搜索条件,输入对应的值,单击回车按钮即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据中对应任务名称,进入查看定时任务详情。 图23 查看定时任务详情 定时任务详情界面中,单击“执行脚本”
若责任人中选择不到排班,请先在排班管理中创建排班。 图2 创建事件单 事件等级定义如下: P1:核心业务功能不可用,影响所有客户 P2:核心业务功能受损,影响部分客户,客户核心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
批量ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 Global 批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 Global 批量FlexusL操作 批量FlexusL操作为用户
人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用
修改分组 提供用户修改分组的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center修改分组。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,,选择分组,单击。 图1
问题列表 填写创建问题基本信息,点击“提交”。 图2 创建问题页面 问题标题:必填,简要填写问题描述 问题描述:必填,具体描述问题现网和对现网的影响,支持上传附件 问题来源:非必填,填写问题来源,来源包含事件、告警、WarRoom和主动运维发现。若是处理事件发现的问题则选择事件。
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
程,避免告警处理异常。 标准化事件处理流程包含以下步骤: 集成管理接入原始告警数据; 配置流转规则,对告警进行清洗处理; 在通知管理中,根据通知场景配置通知模板,选择通知对象以及通知方式; 集成告警中对告警进行处理或转事件处理; 事件中心处理转事件的告警,可进行转发、升降级、启动WarRoom处理。
识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项
coc:instance:startRDSInstance 启用RDS实例的权限。 √ √ x x coc:instance:stopRDSInstance 停止RDS实例的权限。 √ √ x x coc:instance:restartRDSInstance 重启RDS实例的权限。 √ √ x
灾,快速剔除故障节点,保障COC实例持续提供服务。 多AZ容灾 COC支持跨AZ容灾,当一个AZ异常时,不影响COC实例持续提供服务。 数据容灾 通过数据定期备份方式实现数据容灾。 父主题: 安全
”页面。在页面右上角可以看到WarRoom状态。 单击最右侧的更新状态按钮,可以更新WarRoom状态到对应的状态。 1.故障已恢复之前受影响应用必须先走到已恢复状态 2.WarRoom关闭之前,要填写WarRoom故障信息 父主题: WarRoom
骤,若有则单击“添加未修改通知”配置未修改通知时间。 图5 未修改通知 若有删除前通知策略或未修改通知策略,则需要配置通知方式和通知用户。 图6 下拉选择通知方式及人员 添加参数标签,若无需配置跳过即可,若需要配置则单击“添加标签”添加即可。 图7 参数标签 单击“提交”,完成创建后跳转到列表页。