检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 个人:选择审核用户。配置审批用户详细操作请参考人员管理。 通知渠道 通知审核人的通知渠道,通过下拉列表进行选择设置 默认:按照审核人员订阅功能中选择的通知方式进行通知。设置默认通知方式详细操作请参考用户订阅操作步骤。 短信、企业微信
排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 个人:选择审核用户。配置审批用户详细操作请参考人员管理。 通知渠道 通知审核人的通知渠道,通过下拉列表进行选择设置 默认:按照审核人员订阅功能中选择的通知方式进行通知。设置默认通知方式详细操作请参考用户订阅操作步骤。 短信、企业微信
服务器整体运行状况并准确提供异常问题排查定位方法。 注意事项 OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。 OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型
加入群组。 可选参数。选择排班角色,其中的排班人员在启动WarRoom时会被自动加入到第三方移动应用群组。 配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,
若没有合适的应急预案需要创建,单击“创建应急预案”,详细步骤请参考创建应急预案。 若选择脚本,在下拉列表选择相应的脚本,单击“执行响应预案”。 执行步骤7。 若没有合适的脚本需要创建,单击“创建脚本”,详细步骤请参考创建脚本。 若选择作业,在下拉列表选择相应的作业,单击“执行响应预案”。
支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3类目前仅支持手动添加。 修正SLO中断记录,主要功能为通过修改中断记录中的“不可用起止时间”,自动计算不可用时长。
理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被
护。 注意事项 所选实例处于运行中状态,才能执行此操作。 所选实例UniAgent状态为运行中,才能执行此操作。UniAgent相关操作请参考配置UniAgent。 批量操作时,如果勾选的多个ECS不属于同一操作系统,既包含Linux系统ECS,又包含Windows系统ECS,则需要分别进行配置。
问题单受理后,在定位阶段若需要创单人协助提供数据或其他信息;问题实施阶段变更需要审批等场景。支持问题处理人挂起问题单,问题单挂起后默认需创建人审批,若需修改先审批流程,可参考流程管理。 挂起问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
入库人工审核:开启后任务需要审批。审批详细操作请参考审批定时任务。 审核人配置:可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 个人:选择审核用户。配置审批用户详细操作请参考人员管理。 通知渠道:在下拉列表设置通知渠道。
单击需要修改的WarRoom标题。 选择需要处理的应用,单击“执行预案”。 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行”。 若没有合适的应急预案需要创建,请参考创建应急预案。 根据应急预案关联的任务类型。 若任务类型为脚本,执行步骤7。 若任务类型为作业,执行步骤8。 设置“执行脚本”。 脚本入参
绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上限时,需要删除现有的任务才可以创建新的任务。 创建评估任务 登录云运维中心。
说明 转发责任人 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 个人:选择责任用户。配置责任用户详细操作请参考人员管理。 说明 请填写转发说明。 当前阶段定位情况 请填写当前阶段定位情况。 单击“确定”。 完成事件转发。事件责任人为设置的“转发责任人”。
同标签资源实例关联至同一资源分组内进行管理。 注意事项 需要分组的资源关联方式为智能关联时,才支持智能关联功能。修改资源关联方式相关操作请参考修改分组。 需要先单击对应分组,智能关联资源按钮才能生效。 触发智能关联资源后,请您耐心等待关联任务执行,关联时间取决于关联资源数据总量。
说明 转发责任人 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 个人:选择责任用户。配置责任用户详细操作请参考人员管理。 说明 请填写转发说明。 单击“确定”。 完成问题单转发。问题单责任人为设置的“转发责任人”。 父主题:
故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称。 企业项目 故障模式资源所属的企业项目,默认为default。 所属应用 演练目标所属的应用。 事件级别评估 参考事件中心事件级别定义。
”完成创建。 图2 设置策略内容-1 图3 设置策略内容-2 图4 设置策略内容-3 云运维中心当前仅有部分操作支持按照企业项目授权,可以参考表1创建自定义策略。 表1 支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“现网实施”。 设置“现网实施”。 若区域涉及变更,点击操作列关联变更单并进行变更实施。变更单相关操作请参考变更中心。 若区域不涉及变更,点击操作列的“不涉及变更”。 支持添加区域和删除已有区域。 单击“实施完成”。 完成问题单现网实施,问题单状态为“待验证”。
参数信息与创建流转规则基本相同,请参考创建流转规则。 设置完成后,单击“确定”。 完成流转规则修改。 复制规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要复制的规则,单击操作列“复制”。 参数信息与创建流转规则基本相同,请参考创建流转规则。 设置完成后,单击“确定”。