检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建流转规则 操作场景 用户通过流转规则可以实现事件、告警等规则的自定义配置。通过配置流转规则,将原始告警转成汇聚告警或事件。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 单击右上方“新增规则”。
设置完成后,单击“确定”。 完成流转规则修改。 复制规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要复制的规则,单击操作列“复制”。 参数信息与创建流转规则基本相同,请参考创建流转规则。 设置完成后,单击“确定”。 完成流转规则复制。 删除规则 登录云运维中心。 在左侧导航栏选择“故障管理
流转规则 概述 创建流转规则 管理流转规则 父主题: 故障管理
补丁基线中安装规则基线与自定义基线的区别? 安装规则基线提供了用户能够根据补丁包的基本信息进行基线筛选的能力,使用安装规则基线修复会将不合规的补丁升级为最新版本。 自定义基线提供了用户能自定义补丁包名称以及版本进行基线筛选的能力,使用自定义基线修复将会将不合规的补丁升级到自定义指定版本。
在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”。 选择需要修改的起会规则,单击操作列“修改”。 设置“修改起会规则”。 表2 修改起会规则参数说明 参数 说明 规则名称 自定义规则名称。 区域 可选参数。在下拉列表选择涉及的区域,支持多选。 不选择区域展示“默认”,表示不涉及区域。 应用
图2 查询SLA记录详情 SLA记录详情里的“SLA信息”表展示了工单的“SLA状态”与创建SLA模板时设置的SLA规则强相关,当工单的状态类型持续时间超过了SLA规则设置的时间,状态自动修改为“已打破”。 “持续时间”与工单的状态变化强相关。 父主题: SLA管理
createJobScript 删除自定义脚本 Document deleteJobScript 修改自定义脚本 Document editJobScript 审批自定义脚本 Document approveJobScript 执行脚本 Document executeJobScript
可开启SLA目标,在开启SLA之后,最多可以设置7天 通知对象 通知对象分为 工单责任人 排班 个人 其中工单责任人是默认通知 通知渠道 通知渠道分为 默认 短信 企业微信 钉钉 邮件 飞书 不通知 单击“确定”对SLA规则进行修改。 图7 配置SLA规则 生效时间默认选择“7天*24小时
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息
登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息,可配置自动通知能力,具体参考通知管理。
问题管理支持设置通知提醒,需要在通知管理中配置通知规则,具体操作详情参考通知管理,通知类型需要选择“问题通知”。 前提条件 需要先在应用管理中创建您的应用。 创建问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 单击右上方“创建问题单”。 设置“创建问题单”。
概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则
的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规则、事件中心、自动化运维、通知管理、变更管理等运维服务中设置人员类参数时使用。 排班场景概述 排班管理中可以设置多种排班,一个排班场景即是一种
集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。 对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相
条相同通知信息;个人场景下处理逻辑同理。 当规则中不设置规则值时,代表不经过该规则匹配,举例:若A规则不设置值时,不考虑其他匹配规则的情况下,该通知实例生效(不对A规则进行匹配),且当A规则未来发生变化后,该通知实例依旧生效(不对A规则进行匹配)。 通知创建后,默认启用状态。 编辑通知
事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。 修改规则 仅管理账号可修改复盘规则。
启动了WarRoom所有级别的事件需进行复盘,该规则可在故障复盘规则中修改。 故障复盘 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击“全部事件单”页签。 选择需要复盘的事件单,单击故障报告/状态列“故障报告”。 系统会将事件单的基本信息自动填充至复盘信息中
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。 轮班(周一 -- 周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同
步骤二:创建流转规则,清洗原始告警数据 登录COC。 在左侧导航栏选择“故障管理 > 流转规则”,进入“流转规则”页面。 在流转规则列表上方,单击“新增规则”进入“创建流转规则”页面。 图5 新增流转规则 根据页面提示,输入规则名称、应用名称等基本信息。 在触发规则部分,选择触发类