检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将接入数据导流至数据表中 监控服务已接入的数据,会保存在已创建或者系统自动创建的Kafka的Topic中,需要创建导流任务,将数据导流至ClickHouse或Influxdb数据表中。 将数据导流至ClickHouse/Influxdb表 进入AppStage运维中心。 在顶部导航栏选择服务。
为指标创建不同类型的视图 创建数据视图,后续可以使用视图进行数据业务报表开发、告警配置等运维监控。 如果需要在大盘监控单个指标的报表(如折线型报表),可以创建单指标查询视图。 如果需要在大盘同时监控多个指标(如表格型报表),可以创建多指标组合查询视图。 持久化视图(自定义汇聚粒度)、长
使用运维中心通报运维事件 创建运维事件通知组 创建运维事件并发送通知 创建WarRoom事件通知 父主题: 使用监控服务进行资源及业务监控
根据表或任务类型查看数据血缘 监控服务支持查看运维数据的数据血缘、关系及数量等信息。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看数据血缘 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
EAP流程 创建预案对多流程进行管理与执行 创建标签并为流程关联标签 查看流程执行历史 查看已上架的EAP动作 父主题: 使用监控服务进行资源及业务监控
订阅BaaS服务已共享指标 服务想要获取BaaS服务的横向数据,比如说音乐或视频业务想实时查看SLB、ELB的指标监控,可以通过指标共享的方式获取指标,支持按照标签或指标级进行共享。 BaaS服务数据开发人员创建并共享指标后,服务运维和开发人员在标签查询中可以按标签查询指标的定义,服务无指标编辑权限。
算子清洗功能介绍 功能说明 Filebeat是一个轻量级的采集器,用于采集和处理,转发日志数据。Filebeat将作为代理安装在您的服务器上,监控您指定的日志文件或位置,收集日志事件,并将它们转发到kafka,推送到下一个处理点。 processors是filebeat定义了一系列对单条日志操作的方法,目前支持三类操作:
创建运维事件并发送通知 监控服务支持对现网发生的可能造成或者已经造成服务中断、业务质量下降的系统告警等问题创建运维事件并发送通知。 创建运维事件并发送通知 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“故障通报
创建并执行EAP流程 流程是通过使用事件自动化平台(Event & Action Platform,EAP)所提供的运维中心各个子系统的系统动作,组合编排来解决复杂运维场景,如需查看当前已上架的EAP动作,请参见查看已上架的EAP动作,可以了解已上架动作类型、作用、输入和输出参数。本章节介绍如何创建及执行流程。
创建日志清理作业定时清理日志 监控服务支持配置日志清理作业,完成目录及文件的压缩、删除和清空操作。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建日志清理作业 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建告警屏蔽规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 策略配置”。 单击“告警屏蔽”,进入告警屏蔽页面。 单击“添加”,进入告警屏蔽规则页面。
运维中心监控服务 如何查看EAP详细日志? 删除告警任务失败 告警后触发知识编排任务提示alert_type不存在 创建CES指标采集报错
警的值班责任人。 处理方式:包括立即通知、语音通知、转监控中心和不通知四种方式。 立即通知:告警上报后会立刻触发通知流程。 语音通知:会有三分钟左右的延迟,取决于告警上报的时间。 转监控中心:给AppStage运维中心的监控中心人员打电话。 不通知:告警上报后不通知。 如果是按月
创建或关闭告警进行模拟测试 监控服务支持手动创建或关闭告警,对告警的其他规则进行模拟测试。 创建告警:快速创建告警,创建的告警与生成上报的告警流程相同,可以用来测试创建的告警升级规则、告警修复规则、值班组等是否正确生效。 关闭告警:关闭已创建的告警,手动恢复该告警。 前提条件 已
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建告警升级规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 策略配置”。 单击“告警升级”,进入告警升级页面。 单击“创建”,进入创建告警升级规则页面。
作业清单页面可以查看虚拟机作业清单、容器作业清单。 查看作业清单 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。 默认进入“虚拟机作业清单”页签
创建定时作业定时执行脚本 监控服务支持配置定时作业,通过指定作业执行的时间、周期,分批次执行作业脚本。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建定时作业 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
的计算公式。经过监控系统计算后,如果数据持续异常,则上班到告警系统中,产生告警。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建AIOps规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
以配置合适的值用来监控此类接口。 no_model_threshold_lower 无模型阈值下限 0-100000000 默认值0 无模型时配置的阈值下限(固定阈值线)。 对于新增的接口,因为没有历史数据,无法训练出该接口的模型,此时可以配置合适的值用来监控此类接口。 alert_by_std
告警修复的触发场景如下: 告警上报时,满足现存的告警修复规则。 告警进入系统时满足告警屏蔽的规则,根据告警屏蔽规则的配置决定是否执行告警修复。 告警列表中对告警进行清除操作。 告警修复本身不影响告警的状态,属于对告警进入系统时或告警清除时的额外处理操作。 前提条件 已获取服务运维岗位权限