检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
比、趋势图和Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别和时间窗,反映重大故障场景的发生和改善情况。回溯改进中包含回溯改进的闭环率和趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率和处理时间。指标详情可查看表3。
系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单击操作列“编辑”修改事件级别和描述。,
事件审批 操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
流程管理”页面,单击页面问题流程>问题审批,可配置问题降级和问题挂起的审批流程。系统默认问题降级和挂起需要创单人审批 图1 问题审批 单击“新建问题审批”配置问题降级或问题挂起的流程,选择问题流程、问题级别和审批配置。 图2 新建问题审批流程 配置完成后在问题处理页面进行问题单降级和问题单挂起。 图3 问题处理页面
变更单创建后,可以通过变更日历查看变更单的分布和详情,支持按月和日展示,具体操作如下。 查看日历 登录云运维中心。 在左侧导航栏选择“变更管理 >变更日历”。 页面默认显示本月审批后的变更分布,单击变更标题可进入变更单详情页面。 支持按照变更应用、变更级别、状态和变更标题筛选。 若需查看某天的变更信息可点中对应的日期。
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
概述 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照事件和问题管理流程制定级别的类别的枚举值,便于满足当前业务。 父主题: 流程管理
通知管理主要是提供变更、事件、问题等消息通知模板,满足不同阶段和场景的通知诉求。同时支持按需订阅通知,防止信息多,无法获取重要信息。 当产生事件单、问题单、告警单或有变更单时,通知规则会根据事件/问题/告警/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的方式,进行消息通知,实现了自动通知的功能。
SLO中断记录 操作场景 用户可以通过此页面查看、添加和修正SLO中断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3类目前仅支持手动添加。
审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户
strings 责任人,排班场景和排班角色(排班场景和排班角色是作为组合项)不能同时为空,必须选择一个 最小长度:0 最大长度:255 数组长度:0 - 1 assignee_scene 否 String 排班场景,排班场景和排班角色(排班场景和排班角色是作为组合项)不能同时为空,必须选择一个最小长度:0
联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
待办中心 概述 待办中心用于记录和跟踪日常待办事务,并提供提醒功能。 在COC待办中心,您可以创建待办任务给指定人员处理,设置截止时间,填写待办任务的推荐方案,创建待办后可通过短信、邮件等方式通知责任人。 除了上述功能外,创建待办任务时还支持设置标签和添加附件。 待办任务创建成功后
看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。
使用场景 变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不使用系统预置
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
查看容量详情 操作场景 云运维中心支持查看应用、子应用、组件或分组下已关联的资源容量详情,按照资源类型展示资源核心数据和排名。 查看容量详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要查看的应用、子应用、组件或分组,单击右侧“容量”。
演练报告 操作场景 演练报告包含创建、编辑、改进事项以及故障记录的查看,以便用户全面地记录和管理演练活动及其结果。 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表
排班方式:排班的方式,可选择“固定班次”和“轮班(周一 -- 周日)”。 固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。 轮班(周一 -- 周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班