检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
韧性中心 混沌演练 应急预案 PRR评审
补丁修复后合规性报告仍然为不合规如何处理? 单击修复后生成的合规性报告摘要 图1 合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启 补丁已安装修复,待机器重启后生效,机器重启后扫描即可解决不合规问题
图1 新增影响应用 在主屏可以看到添加的应用,支持填写故障开始时间、恢复时间及故障描述。提交后该应用的状态会变为恢复状态。 受影响应用支持执行应急预案快速恢复故障、同时可以查看该应用的告警、事件和变更信息。 图2 影响应用页面 父主题: WarRoom
处理问题 操作场景 创建问题单后,问题责任人需受理、定位并提交问题解决方案。 受理问题 驳回问题 问题定位出方案中 问题待现网实施 升降级 挂起问题 待验证 父主题: 问题管理
COC结合典型的客户业务场景,总结了几种最佳实践案例,方便您快速加深对COC的认识。 最佳实践 标准化故障管理 全旅程混沌工程方案 一站式资源运维 常见问题 了解更多常见问题、案例和解决方案 热门案例 COC权限如何配置? 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理?
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
点击问题单名称进入问题详情页面,单击右上角“验证”,跳转验证详情,填写信息后点击提交。 图1 问题单验证页面 验证通过后问题单闭环;验证未通过问题状态会走到定位出方案中。 父主题: 处理问题
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
步骤二:创建应用 管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 步骤三:创建演练任务 针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。 步骤四:启动演练 按照已经创建的演练任务,自动化的故障注入。 准备工作 注册账号并实名认证。 在
管理。 图3 分配COC策略 如已有包含云运维中心策略的群组,可选择"继承所选用户组的策略"方式授权,可参考IAM用户授权。 选择授权范围方案,指定企业项目资源。 完成授权。 图4 完成授权 父主题: 产品咨询
力客户作业可信和稳定可靠。 标准化故障管理,加持WarRoom作战驾驶舱,实现故障高效协同和快速恢复。 智能化混沌演练,全旅程混沌工程解决方案,颠覆传统被动运维模式,推动客户向主动运维变革。 父主题: 使用前必读
需要按region配置实施人&配合人; 需要按region配置计划变更时间窗(注:允许变更时间窗受变更级别&变更类型限制); 7、任务类型:选择作业或变更方案 以上内容填写完成后,单击“提交申请”后进入审批环节。 父主题: 变更中心
除以上的参数,其他参数均放在该参数中,使用additional.xxx表示,AOM相关字段描述点击这里查看 在响应预案部分,选择针对本次流转规则相关联的脚本、作业和应急预案,脚本和作业的添加请参考自动化运维。 脚本、作业和自动化预案支持故障自愈能力,选择脚本作业和自动化预案后会显示“自动执行”勾选项,勾选后带出脚本或作业对应的参数
ECS)上执行操作。 Global 定时运维 提供用户从脚本、作业等已有能力选择任务并且创建定时任务的能力。支持单次执行和周期执行两种执行方案,周期性包括Cron表达式和简单周期执行。 Global 参数中心 支持Region级参数全生命周期管理,持续看护参数正确性和一致性。支持作业编排等运维场景快速引用。
自定义故障 操作场景 通过Cloud Operations Center创建一个攻击场景为自定义故障的演练任务。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器
必选参数。 通知渠道分为: 默认 短信 企业微信 钉钉 邮件 飞书 不通知 截止时间 必选参数。 待办需要闭环的时间点 标签 可选参数。 推荐方案 必选参数。 可输入中文字符、英文字母、数字及特殊字符,长度不超过1000字符 选择输入标签、文件上传等可选字段。 单击“提交”,当右上角显示“创建待办成功”字样,即创建成功。
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
已解决待验证 当触发类型为告警单,状态类型有 告警中 当触发类型为待办任务,状态类型有 待受理 处理中 当触发类型为问题单,状态类型有 未受理 定位出方案中 待现网实施 待验证 SLA目标 可开启SLA目标,在开启SLA之后,最多可以设置7天 通知对象 通知对象分为 工单责任人 排班 个人 其中工单责任人是默认通知
warroom_id String warroom_id 最小长度:0 最大长度:255 handle_time Long 最后一次提交解决方案时间戳 最小值:1 最大值:9999999999 status String 状态KEY,参考:枚举 事件状态 最小长度:0 最大长度:255
责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。