检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用的指标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prometheus等工具进行监控,避免使用AOM的采集器监控您的业务。
连接池、ApacheHttpAsyncClient连接池、DubboConsumer监控、HttpClient监控、NodeJsHttpClient监控、NodeJsHttpServer监控。 相关配置请参见查看组件外部调用监控项。 通信协议 通信协议监控项可以对通信协议的访问进
本文以监控ECS主机的“node_network_up”指标为例,帮助您快速上手使用AOM。 操作流程 ECS主机手动安装UniAgent:手动为ECS主机安装Uniagent,统一管理指标采集插件。 AOM接入弹性云服务器 ECS:通过Node Exporter插件将ECS
中选择,例如,手动刷新、1分钟等。 可根据需要选择是否在组件列表对组件执行如下操作: 增加别名 当组件名称比较复杂,不便于识别时,可为该组件增加一个便于识别的别名。 在组件列表中,单击组件所在行“操作”列下的,输入别名,再单击“确定”,别名添加成功。添加的别名只允许修改,不允许删
搜索框的筛选条件设置为“自定义属性”,然后输入自定义属性信息“自定义属性名称=自定义属性值”。 自定义属性:nodeIP=192.168.0.106,即可查询出指定时间范围内自定义属性主机IP(nodeIP)为192.168.0.106的相关告警。 您可参考表2执行如下操作: 表2 操作说明 操作
况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条
均以“PAAS.”开头,如表1所示。 表1 系统指标命名空间 命名空间名称 说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。
描述 app_id String 应用id。 node_ids Array of NodeInfo objects 节点信息列表。 表12 NodeInfo 参数 参数类型 描述 node_type String 节点类型。 node_id String 节点id。 表13 EventAlarmSpec
描述 app_id String 应用id。 node_ids Array of NodeInfo objects 节点信息列表。 表12 NodeInfo 参数 参数类型 描述 node_type String 节点类型。 node_id String 节点id。 表13 NoDataCondition
name String 模板名称 最小长度:1 最大长度:64 need_synchronize Boolean 是否需要同步 nodes Array of Node objects 任务执行时需要的参数列表。 数组长度:1 - 20 parameters Array of Parameter
配置弹性云服务器 ECS接入AOM Node Exporter是Prometheus的开源指标数据收集插件,负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。通过接入弹性云服务器ECS,您可以为主机组安装Node Exporter并配置采集任务
avg(label_replace(avg_over_time(aom_node_cpu_usage{hostID="81010a40-1682-41c1-9645-f0588ff9c0cf",nodeIP="192.168.1.210",clusterId = '000000
name String 模板名称 最小长度:1 最大长度:64 need_synchronize Boolean 是否需要同步 nodes Array of Node objects 任务执行时需要的参数列表。 数组长度:1 - 20 parameters Array of Parameter
memcached-exporter spec: type: NodePort selector: k8s-app: memcached-exporter ports: - protocol: TCP nodePort: 30122 port: 9150
kafka-exporter spec: type: NodePort selector: k8s-app: kafka-exporter ports: - protocol: TCP nodePort: 30091 port: 9308
"containerName", "nameSpace", "namespace", "netDevice", "nodeIP", "nodeName", "node_ip", "pailId", "pailName", "period_expr", "podID", "podName"
参数类别 参数名称 说明 组件设置相关参数 组件名称 组件的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 组件的描述信息,最多可输入255个字符。 子应用设置相关参数 唯一标识 子应用的唯一标识。 支持输入2~64个字符,只能由
单击列表右上的导出列表项,可以导出当前页的列表信息,最大支持导出100条。 单击“总次数”列的蓝色数值,可以查看所选时间段内该线程异常总数的趋势图。 单击“消息”列的蓝色文字,可以查看消息的详细内容,包括:时间和消息内容。 单击“异常堆栈”列的“查看详情”可以查看异常的详细信息。 单击“异常堆栈”列的“历史信息”可以查看该类名的历史异常堆栈列表。
OW_ID 最小长度:1 最大长度:64 task_status String 任务状态 最小长度:1 最大长度:32 nodes Array of Node objects 任务节点 数组长度:1 - 20 edit_time Long 编辑时间 最小值:0 最大值:9999999999999