检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警监控 告警中心 父主题: 运维空间
父主题: 告警监控
事件的产生可以是手工创建,也可以是告警监控自动生成。解决方案工作台上的运维事件分为P1~P5五个严重等级,P1最为严重,依次递减。
运维事件中心介绍 基于解决方案工作台运维事件中心,提供一站式运维数字化平台,包含丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障SLA管理等功能。 您可以参考快速入门使用解决方案工作台进行一站式运维了解运维事件中心的使用流程。
创建监控对象:选择对应的Region、IAM项目、DataArts studio实例、DataArts studio空间 图19 创建监控对象 添加作业监控 图20 添加作业监控 查看检查结果 平均运行时间:该作业历史30天内执行的平均时间(中间的虚线)。
用户组授权,对用户权限进行管理,包括运维管理员策略、运维工程师策略、客户策略,并且关联服务,后续服务的事件会同步到该用户组,详情请参考用户组授权 运维工程师排班,以便能及时响应事件,详情请参考用户组排班 配置SLA管理策略,详情请参考SLA管理 接入告警源,实现基础设施和应用的统一监控
运维空间 运维事件中心介绍 开始使用运维事件中心 首页 工单管理 告警监控 业务配置 数据报表 用户管理
当前以服务为维度进行告警监控; 监控描述:自定义输入该监控的具体信息。
运维空间:项目转维后,可创建运维空间,在运维空间进行告警源监控、运维事件单管理、服务商SLA管控等。 空间成员与角色 解决方案工作台通过工作空间实现不同用户的信息和资源隔离,只有加入了工作空间的用户才可以看到该工作空间,并且可以通过设置用户在空间内的角色来控制用户的操作权限。
进入运维空间后,在左侧导航栏选择“业务配置”->“流转规则”,点击【新建】按钮进入新建界面; 配置流转规则的基本信息,包括规则名称、规则所属项目、所属服务和规则描述信息; 图1 新建流转规则 配置触发规则,即,相应的监控源产生的告警信息满足什么条件后会触发流转,如:CES监控告警信息中含关键字
图4 配置调研规则入口 添加要监控的数据源,配置想要采集的数据连接的库表信息,以及所需采集的空值字段的表名和表字段名的采集。前提:已在管理应用系统和数据连接中创建好对应的连接。 图5 添加监控对象 点击右下角的【下一步】,配置鉴权码。 数据调研结果可在线上报或离线导入。
运维能力:运维监控告警接入,手工运维事件单。 面向所有的华为云用户开放提供。 增强包 方案设计功能增强包 包年/包月 信息架构(IA)架构设计。 开启后设计中心与交付中心具备对应的IA设计能力。 方案验证功能增强包 包年/包月 功能、UI、API、性能、安全自动化测试。
运维空间:包含统一告警接入、事件流转、工单管理、统计分析和SLA监控等功能,满足运维事件管理场景。 空间描述:自定义空间相关描述介绍。 图1 创建交付空间 点击“保存”,完成空间创建。 完成空间创建后,如需修改空间信息可在空间名称右侧点击“空间编辑”进行更新。
在物理模型的列表界面选择导入,从数据调研导入,选择数据调研的监控对象,选择确认导入。 图4 从数据调研导入 从SDI层导入 DWI层物理模型支持从SDI层导入数据,前提:DWI层的数据库类型和SDI层数据库类型一致。
监控描述:自定义输入该监控的具体信息。
图35 添加采集信息 预览监控对象配置信息,并将该信息复制到5中的配置文件application.properties内,运行探源工具,获取监控信息。 图36 预览监控对象配置信息 查看检查结果。
图1 运维空间首页 图2 入门操作指导 信息总览 首页可查看空间内的信息总览,包括:事件总览(各状态的运维事件数量),关键信息(用户、用户组、项目、服务、监控源的总数),告警总览(各严重等级的告警数量)。 图3 首页总览 父主题: 运维空间
表4 运维事件中心功能 功能 子功能 简介 监控接入 支持CES、Zabbix、AOM、Prometheus、Grafana、SkyWalking、eSight以及Automation(AOM 2.0)监控源统一接入,告警信息高效处理。
CCE部署的场景,请参考下方的操作进行: 对于CCE的场景,如需要通过华为云 AOM控制台(旧版)-总览-仪表盘-添加数据指标-曲线图-下一步, 图13 AOM创建仪表盘 然后在左侧选择需要监控的容器内的组件名称(可对选),在右侧可选择需要监控的指标,一般性能测试就是监控“物理内存使用率
API自动化,可一键生成测试报告,助力基线构建/自定义验证/认证测试效率提升2-6倍; 交付中心:提供项目的在线管理功能,包含实施方案设计与部署、实施管理、项目上线等,支持数据治理实施交付作业管理,助力项目交付降本增效50%; 运维事件中心:提供一站式运维数字化平台,包含丰富的告警源监控集成