检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
资源批量操作 概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
概述 您可以通过云运维中心的应用管理功能对资源进行分组管理,管理云服务对象与应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。
用户添加策略:进入“IAM”服务,选择“用户”,点击“添加权限”,选择“直接附加策略”,将上一步中创建的策略选上,点击“下一步”完成添加权限。 选择需要同步资源所属账号。 默认选择“我的资源”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 单击筛选框右侧。 父主题: 资源管理
设置“创建应用”。 每个层级的必填字段填写完成需要点击“保存”进入下个层级,所有层级的必填字段填写完毕后,才可以点击“创建”按钮创建应用。 表1 创建应用参数说明 参数 说明 示例 应用结构类型 请根据应用结构的复杂类型选择。 轻量级应用 应用名称 根据命名规则,自定义应用的名称。 测试应用
主键id,对应job_order_do的主键 最小值:1 最大值:9223372036854775807 order_name String 工单名称 最小长度:1 最大长度:64 execute_uuid String 列表跳转到详情时,用这个uuid,对应execute_data_do的execute_uuid
需要先在应用管理中创建您的应用。 创建问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 单击右上方“创建问题单”。 设置“创建问题单”。 表1 创建问题单参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述 对问题进行描述,具体描述问题现象和对现网的影响。 上传附件
> 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“修改”。 设置“修改”。 表1 修改参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述 对问题进行描述,具体描述问题现象和对现网的影响。 上传附件 单击“添加文件”上传问题相关附件。
删除前通知时间必须大于参数创建或修改的时间。 未修改通知时间不能小于参数创建或修改的时间。 有到期删除策略时,未修改通知时间不能大于到期删除时间。 (可选)单击“添加标签”。 标签的键仅支持包含数字、字母和_- . : /= + @特殊字符,限制长度1-128个字符。 标签的值仅支持包含数字、字母和_-
脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接,需要用户自行修改解释器,适配为机器可执行的解释器。 校验高危命令:可对脚本内容进行高危检测。 校验范围:检测涉及的高危命令范围,可点击“高危命令说明”查看校验的规则列表。
操作场景 事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 创建改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“ > 创建改进单”或“创建改进单”。
在设定的时间通知参数即将删除。最多可设置2次。 未修改通知:可选参数,设置未修改通知时间,若参数到设定时间未被修改,会按照通知方式和通知用户在设定的时间通知,最多可设置2次。 通知方式:添加“删除前通知”或“未修改通知”时需要设置,在下拉列表选择通知方式。按照通知人员预留的信息进
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案”。 表1 定位出方案参数说明 参数 说明 问题应用 默认创建问题选择的应用。在下拉列表选择涉及问题的应用。 是否为共性问题 可选项“是”、“否”。 发现问题版本号 可选参数。请输入问题对应的版本号。
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。 表1 改进处理参数说明 参数 说明 问题原因 请填写问题发生的原因。 限制长度1-1000个字符。 改进措施 请填写详细的改进措施。 限制长度1-1000个字符。
类问题。 事件类别 可选参数。在下拉列表选择事件的类别。 区域 可选参数。默认“不涉及”。在下拉列表选择事件发生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及的故障应用。 业务是否中断 可选项“是”、“否”。
source String 事件来源 最小长度:0 最大长度:255 regions Array of regions objects 影响的Region 数组长度:0 - 1000 change_num String 变更单号 最小长度:0 最大长度:255 occur_time
制定PRR模板参数说明 参数名称 说明 模板名称 PRR模板的名称 模板描述 PRR模板的详细描述 应用分类 PRR模板所属的应用分类 PRR检查项 PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息 制定检查项信息,单击选择检查项所属的评审阶段“产品立项/产品设计/产品上线“,