检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发生变化。指标是指在被观测系统中观察和收集的资源使用或行为的测量值,可能是原始采集的数据,也可能是后期经过各种计算和统计方法得到的数值。 指标类型如下: 基础指标:基于逻辑主体创建指标,包含一系列过滤条件和一个聚合规则,例如某视频播放网址视频的下载总数,可以对操作类型type=d
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。 单击“数据治理 > 标签管理 > 标签查询”,进入标签查询页面。 勾选指标类型,并过滤需要打标签的指标,如图1所示。 图1 过滤指标 在过滤后的指标列表中
预留5组键值对,用来存储采集到的多维度的数据 查看监控指标数据 以采集弹性云服务器的监控指标为例,查看弹性云服务器对应的命名空间、指标ID、维度的Key和Value。 在支持监控的服务列表页面查看对应的监控指标参考文档。 在参考文档中查看命名空间,弹性云服务器对应的命名空间为“SYS.ECS”。
模拟测试告警 监控服务支持手动创建或关闭告警,对告警的其他规则进行模拟测试。 创建告警:快速创建告警,创建的告警与生成上报的告警流程相同,可以用来测试创建的告警升级规则、告警修复规则、值班组等是否正确生效。 关闭告警:关闭已创建的告警,手动恢复该告警。 前提条件 已获取服务运维岗
设置汇聚任务执行时选择之前的时间段。 例如汇聚时间提前1小时,每次查询的时间范围自动往前偏移1小时;当查询范围是小时、天的时候,一般不需要配置;分钟汇聚任务,由于延迟原因,一般都需配置。 结果时间偏移 设置汇聚出的结果存入输出表的时间值。 例如结果时间偏移1小时,每次查询的数据存入MPPD
如何卸载虚拟机上安装的filebeat? 使用运维中心监控服务配置虚拟机日志接入时,通过任务下发日志采集配置内容并安装filebeat。当用户不再使用运维中心或不再使用虚拟机时,可以手动卸载虚拟机上安装的filebeat。 前提条件 已获业务主机root账号密码。 操作步骤 使用root账号登录业务主机。
接入CES告警 云监控服务CES提供对监控指标的告警功能,用户可以对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 AppStage运维中心支持将CES产生的告警接入至监控服务中,
接入其他公有云数据 接入CES指标 接入CES告警 接入AOM告警 接入CES指标并生成业务报表 父主题: 监控资源和应用
创建数据表 使用监控服务进行数据开发与管理时,需要先创建数据表,将接入的数据存储至数据表中。 创建MPPDB表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。
查看主机监控报表 如果在监控服务配置采集主机监控指标数据,会生成主机监控报表,可以从主机列表跳转查看主机监控报表。采集主机监控指标数据的操作请参见采集Linux主机监控指标操作流程。 查看主机监控报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。
使用EAP进行流程管理 创建并执行EAP流程 创建WeLink触发规则 创建预案 为流程创建并关联标签 查看流程执行历史 查看已上架的EAP动作 父主题: 监控资源和应用
在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > EAP > 动作”,进入“动作”页面。 在列表中查看动作名称、类型、输入、输出, 单击“操作”列的“查看”,可以查看动作的具体元数据信息。 父主题: 使用EAP进行流程管理
应用运维管理AOM是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AppStage运维中心支持将AOM产生的告警接入至监控服务中。 接入AOM告警操作步骤
24:00)的配置。如果一天只有一个配置,则不需要对时间进行分片;如果一天内根据不同的时间段有不同的限制,则可以对一天(00:00 - 24:00)进行分片处理,分为几个时间段再进行配置。 按周 按周的模板是按天的进阶版,在按天的基础上,按照自然周的形式增加了对于周工作日的判断。和一
消息 输入需要匹配的告警消息字符串,可以包含消息、告警名称、告警详情字段,长度不超过255字符。 输入的内容会作为匹配关键字,只有完全包含关键字的告警才会被过滤。 例如告警详情为“尊敬的op_svc_Macro:您的对象存储服务-桶名称“connector-icon”的有效请求率已触
WarRoom是由运维代表决策,Oncall团队负责操作创建,针对重大故障的一种应急处置的协同机制,创建WarRoom,并选择相关人员进行通知。 在重大故障发生时,需要知会问题处理经验比较丰富的运维、开发和问题相关的外部专家,通过添加通知组功能提前预置。 前提条件 已获取服务运维岗位权
创建告警收敛规则 多个维度的告警,通过特定的条件将它们变为一条告警,只需要配置自定义的收敛规则,就可以将重复告警收敛到一起,还有默认的规则帮助用户维护告警。 告警收敛的对象是已经入库的告警,系统启动收敛任务,根据当前告警的状态将告警收敛成已解决的父告警和告警中的父告警,同时会写入告警的数据库中。
订阅BaaS服务已共享指标 服务想要获取BaaS服务的横向数据,比如说音乐或视频业务想实时查看SLB、ELB的指标监控,可以通过指标共享的方式获取指标,支持按照标签或指标级进行共享。 BaaS服务数据开发人员创建并共享指标后,服务运维和开发人员在标签查询中可以按标签查询指标的定义,服务无指标编辑权限。
创建告警升级规则 当需要提升告警的级别时,可以通过配置告警升级规则完成。例如严重告警和紧急告警关联的值班模板不同,可以通过升级告警级别,为指定告警修改值班人员。 如果某个告警命中了升级规则,被升级后,会按照对应级别的流程处理,包括是否被抑制、是否自动恢复、是否通知、以什么渠道通知
创建告警修复规则 告警修复是设置特定的命中条件,告警在发送通知之前将会进行预置的修复脚本,修复操作,自动帮助您修复简单的告警。 告警修复的触发场景如下: 告警上报时,满足现存的告警修复规则。 告警进入系统时满足告警屏蔽的规则,根据告警屏蔽规则的配置决定是否执行告警修复。 告警列表中对告警进行清除操作。