检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
审批人通过排班场景和排班角色决定。 审批方式:一人通过 或 全部通过。 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响SLO,COC会自动化地完成SLO的计算,为SLO看板大屏提供数据。 父主题: SLO管理
率加压的故障演练。 操作流程 操作步骤 说明 准备工作 注册华为账号并实名认证,开通云运维中心。 步骤一:同步资源 获取当前用户所属的所有Region下资源数据并同步至云运维中心。 步骤二:创建应用 管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
执行命令 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS执行命令功能,您可以在不登录ECS的情况下,发送脚本命令至单台或多台ECS,快速完成对ECS的日常维护。 注意事项 所选实例处于运行中状态,才能执行此操作。 所选实例UniAgent状态为运行中,才能执行
变更配置:承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 变更管控:是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。
可选参数。单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值可以包含任意语种字母、数字、空格和_ .
统计所有事件单数量 选择时间范围内,所有事件单的数量 天/月 个 事件级别 事件管理 统计各个类型和级别的事件单的数量 选择时间范围内,各个类型和级别的事件单的数量 天/月 个 事件闭环率 事件管理 统计事件单的闭环情况 选择时间范围内,闭环状态的事件单数量/事件单总量*100% 天/月 百分比
系统默认P1/P2/P3/P4级别的事件和启动了WarRoom所有级别的事件需进行复盘,该规则可在故障复盘规则中修改。 故障复盘 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击“全部事件单”页签。 选择需要复盘的事件单,单击故障报告/状态列“故障报告”。 系统会将事件单的基本信息自动填
操作场景 应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 编辑拓扑仅支持编辑组件之间的连线关系。 编辑拓扑不影响应用和组件的层级和功能。 查看和编辑拓扑 登录云运维中心。
交,可以编辑问题单内容后重新提交。 重新提交 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“修改”。 设置“修改”。 表1 修改参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述
单击“确定”。 完成改进单处理。 转发改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要转发的改进单,单击改进单标题。 单击右上方“转发”。 设置“转发”。 表2 转发参数说明 参数 说明 所属应用 在下拉列表选择改进单涉及的应用。 接收责任人
批未通过,问题单状态为发起挂起时的状态。 挂起恢复 挂起恢复需要问题创建人操作。 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“挂起恢复”。 完成问题单挂起恢复。 父主题: 问题管理
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
必选参数。 触发类型有: 事件单 告警单 待办任务 问题单 选择级别 当触发类型为事件单,级别有 P1 P2 P3 P4 P5 当触发类型为告警单,级别有 紧急 重要 次要 提示 当触发类型为待办任务,级别有 紧急 重要 次要 提示 当触发类型为问题单,级别有 致命 严重 一般 提示
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
定位出方案参数说明 参数 说明 问题应用 默认创建问题选择的应用。在下拉列表选择涉及问题的应用。 是否为共性问题 可选项“是”、“否”。 发现问题版本号 可选参数。请输入问题对应的版本号。 区域 可选参数。默认创建问题选择的区域。在下拉列表选择事件发生的区域,支持多选。 若是否需要现网变更参数选择“需要”,参数为必填。
审批变更单 操作场景 变更单创建后,需审批变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,审批变更单。 图1 审批变更单 父主题: 变更中心