检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Write地址访问AOM的Prometheus监控服务,内网地址仅供华为云内部云服务调用。 公网Remote Write地址仅部分局点支持,具体请参见表1。 表1 支持公网数据上报的说明 局点名称 Region名称 公网访问地址 华东-上海一 cn-east-3 aom-access.cn-east-3.myhuaweicloud
*\\s+>\\s+/dev/sd[a-z]+\\s* cat test.txt > /dev/sda 命令中包含 > /dev/xdx,可能导致该路径下的数据全部丢失 init 0 command \\s*init\\s+0\\s* init 0 包含init 0 命令,可能会停机导致影响系统或服务的正常运行
XXX-XXXXXXX的相关事件。 您可参考表2执行如下操作: 表2 操作说明 操作 说明 查看事件统计数据 单击,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 查看事件详情 单击事件名称可查看事件详情和修复建议。 父主题: 告警管理
br>可能原因:当创建的阈值规则的指标数据达到阈值条件时且告警级别为”紧急”,产生此告警。;<br>详情:https://console.xxx/aom/alarmlist;<br>附加信息:阈值规则 lhy_test_001 状态从 “数据不足” 变为 “超限阈值” 。状态变化
在下拉菜单中选择企业项目,仅开通企业版才会显示。 描述 应用的描述信息,最多可输入1000个字符。 接入方式默认选择“增强型探针”。 数据接入方式选择“无侵入接入”,通过接入命令接入。 图2 数据接入 表2 参数列表 环境变量 入参 描述 选项 APM_APP_NAME appName 组件名称,代表一个
租户从IAM申请到的projectid,一般为32位字符串。 limit 否 Integer (0,1000] 取值范围(0,1000],默认值为1000。 用于限制结果数据条数。 start 否 String - 分页信息 Header说明 请求消息头(Header)如表2所示。 表2 Header说明 名称
在已设的监控周期内,当某个资源或资源的指标数据满足告警条件时,产生对应的告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在“告警”页签下查看该告警,具体请参见查看告警。 查看事件 在已设的监控周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。 可在左侧导航栏中选择“告警管理
ofiler性能分析页签。 单击“快照列表”,进入快照列表页面。 在Profiler页签选择您想要查看的实例,可以查看该实例对应的性能分析数据。 图1 快照列表 表1 快照列表参数说明 参数 说明 日期 获取调试信息的时间。 CPU核数 CPU利用率。 内存分配速率 内存的速度,它代表着该内存所能达到的最高工作频率。
异常堆栈 该异常产生的堆栈信息 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 单击列表中“调用次数”、“平均响应时间(ms)”、“错误数”等列的蓝色字体数值,可以查看默认20分钟内该通信协议的趋势图。
进行切换操作。您需要注意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
IP}:30091/metrics。 图2 访问地址 采集CCE集群的业务数据 通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 如下指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标。
diskReadRate 磁盘读取速率 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) aom_node_disk_write_kilobytes diskWriteRate 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) GPU aom_n
组;您还可以根据需要对主机组执行编辑、删除等相关操作,详情请参见其他相关操作。 配置接入规则时以主机组为单位下发采集配置,方便您对多台主机数据进行采集。当用户扩容主机时,只需在主机组中添加主机,该主机会自动继承主机组关联的接入规则,无需为每台主机重复配置。 采集配置。 在“采集配置”中,参考下表配置相关参数信息。
8-profiler及以后版本,支持性能优化推荐。 2.4.7-profiler Agent版本2.4.7-profiler及以后版本,支持用户包数据采集。 2.4.6-profiler Agent版本2.4.6-profiler及以后版本,支持Profiler的Latency功能。 2
500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标 10个 100个 500个 查询指标数据API调用 50万次/月 100万次/月 500万次/月 事件和告警总条数 5万条/月,存储时长7天 10万条/月,存储时长30天 50万条/月,存储时长30天
S的元数据信息与鉴权信息。 1 允许 IPv4 TCP、UDP 53 100.125.0.0/16 用于DNS解析域名,下载UniAgent包时解析OBS地址、解析UniAgent服务端地址。 1 允许 IPv4 TCP 443 100.125.0.0/16 采集监控数据上报到AOM服务端。
LTS控制台入口 参考文档链接 接入管理 接入管理功能支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。 在左侧导航栏选择“接入 > 接入管理”。 登录LTS控制台。
变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。
http://localhost:9114/metric 采集CCE集群的业务数据 通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 如下示例中指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标。
每页查询数量,默认20。每页最多支持查询100条数据。 ecs_id_list 否 Array of strings ecs ID列表信息。最多支持传入100条数据。 agent_id_list 否 Array of strings agent ID列表信息。最多支持传入100条数据。 coc_cmdb_id_list