检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。 如果您使用的是新版仪表盘,设置时间的方式包括:相对时间、整点时间、自定义。 相对时间:表示查询距离当前时间1分钟、5分钟、15分钟等时间区间的数据。例如当前时间为19:
单次执行:在设置的时间执行一次操作。 简单周期执行:根据设置的时间周期循环执行。 周期执行(Cron表达式):根据设置的Cron表达式执行操作。 执行时间 定时任务执行的具体时间。 执行周期 “执行策略”为“简单周期执行”才需要设置。 每天:周期内的每一天。 指定时间:从周日到周一中选择一个或多个,默认全部选中。
普罗语句语法详情可登录prometheus官网查看。 普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes
设置为5,这样函数将会返回最小、25%、50%、75% 和最大,这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。 node_load5 节点5分钟CPU负载 node_filefd_allocated
collect_time 是 Long 数据收集时间,仅支持过去1天和未来半小时范围内的数据上报。即数据收集时间需要满足过去24小时到未来30分内。 取值范围: UNIX时间戳,单位毫秒。例如:2024-10-16 16:03:01需要通过工具转换成UNIX毫秒级时间戳:1729065781000。
选择调用链的HttpMethod。 选填 状态码 调用链返回的HTTP状态码。多个状态码以逗号“,”分隔。 选填 响应时间 调用链的响应时间范围,可以填写最小响应时间和最大响应时间搜索调用链,两个值都可以为空。单位ms。 选填 是否异常 调用链是否有异常。 选填 Trace ID 调用链的
需要被清理的目录或文件不存在。 当前时间减去被清理的文件或目录最后修改的时间小于指定清理的天数。 解决方法 检查需要被清理的目录或文件是否存在,若被清理的目录或文件存在,确保当前时间减去文件或目录最后修改的时间大于指定清理的天数。 例如,要成功清理1天前的文件,当前时间减去文件或目录最后修改的时间要大于24小时。
在下拉列表中选择您想要查看的APM实例,可以查看该实例下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击进行刷新,有两种方式刷新方式:手动刷新和自动刷新。
TemplateInfo objects 变量列表 表19 TemplateInfo 参数 参数类型 描述 name String 变量名称 type String 变量类型 query String 变量值 description String 变量描述 请求示例 查询告警规则列表 h
文件名称、最新写入时间。 单击该实例“操作”列的“查看”,可参考表1查看该实例日志文件详情,如图2所示。 表1 操作说明 操作 设置 说明 设置日志时间范围 日期 单击,选择日期。 时间范围 单击时间轴蓝色部分,设置日志的时间范围。时间轴每次只能选择一个单位时间为5分钟。 查看日志文件详情
checkType为env时checkMode填contain,checkContent格式为 ["k1","v1"]表示进程环境变量中需要包含名为k1值为v1的环境变量。 checkType为scope时checkMode填equals,checkContent格式为节点ID数组["hostId1”
平均响应时间(ms) 平均响应时间(ms) 错误次数 消息处理错误次数 最慢调用(ms) 最大响应时间 创建连接数 创建连接数 关闭连接数 关闭连接数 关闭原因 连接关闭的原因 流量(M) 流量 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数
如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 如您的组织已经设定AOM服务的相关标签策略,则需按照标签策略规则添加告警标签。标签如果不符合标签策略的规则,则
指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。 如果您使用的是新版仪表盘,设置时间的方式包括:相对时间、整点时间、自定义。 相对时间:表示查询距离当前时间1分钟、5分钟、15分钟等时间区间的数据。例如当前时间为19:
设置完成,单击“确定”。 (可选)变量管理。CCEFromProm服务新增PromQL告警规则时,管理变量并应用在告警模板的PromQL中。 单击“变量管理”。 在弹出的对话框“变量管理”中设置变量与变量值。最多可以新增50个变量。 图4 变量管理 设置完成,单击“确定”。 单击“确定”,完成告警模板创建。
自动安装,您不用安装ICAgent。 安装前提 在进行ICAgent安装前,需要先确保本地浏览器时间与服务器时区、时间都一致。若有多个服务器,则要保证本地浏览器、多个服务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 ICAgent进程需要root用户安装和运行。
删除应用发现规则 aom:discoveryRule:set 添加应用发现规则 添加应用发现规则 aom:metric:list 查询时间序列 查询时间序列 aom:metric:list 查询时序数据 查询时序数据 aom:metric:get 查询指标 查询指标 aom:metric:get
AOM告警规则中,资源项有时会出现数据不足的情况,如下图所示。 图1 查看规则状态 可能的原因如下: 数据上报延迟过大(曲线图最新数据上报时间和当前时间的时间差大于一个周期,阈值上报周期设定中可选1分钟和5分钟),上报周期内获取不到数据会报数据不足。 指标删除或指标所在的宿主已不存在,而阈值规则仍在,此时会报数据不足。
在图中展示异常时间段,并标注首个异常点及其上界。 应用服务整体平均响应时间突增事件详情: 图4 应用服务整体平均响应时间突增 应用服务整体错误率突增事件详情: 图5 应用服务整体错误率突增 TopN接口平均响应时间突增事件详情: 图6 TopN接口平均响应时间突增 TopN接口错误率突增事件详情:
a®ion=region-7&_dmax_signature=L6PZM7avdA***tk%3D,请记录对应变量的值。 图5 获取全局变量的值 修改全局变量的值。 将鼠标放在模板上,单击“编辑”,系统自动为您创建一个业务指标监控大屏页面。 单击已创建的页面,再单击“编辑页面”,进入业务指标监控大屏编辑页面。