检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM可以支持设置阈值告警的指标类型如下。 类型 指标举例 组件(进程) CPU内核总量、CPU内核占用、CPU使用率等 主机网络 接收Bps、接收错包率、发送错包率、总Bps。 主机磁盘、文件系统 磁盘读取速率、磁盘写入速率、磁盘使用率。
io/zh-cn/docs/tutorials/security/seccomp/。 6 Profiler为目标进程的每个线程分配8kB的perf_event缓冲区。Linux内核中限制了进程perf_event相关的MMap的总内存大小。在非特权用户下运行时,确保/proc/sys/ker
objects 规则发现部分,数组中有多个对象时表示需要同时满足所有条件的进程才会被匹配到。checkType为cmdLine时checkMode填contain,checkContent格式为["xxx"]表示进程命令行参数中需要包含xxx。checkType为env时checkMo
集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。 PAAS.SLA SLA指标的命名空间。 自定义指标的命名空间:用户自定义,自定义时命名空间必须以字母开头,但不能以“PAAS
P地址支持IPv4、IPv6。 通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 注意事项 一个主机最多可添加5个标签,且标签键不能重复。 不同主机可添加同一个标签。 通过创建CCE、Ser
该指标用于统计主机本地时间与NTP服务器时间是否同步。 0、1 0表示同步 1表示未同步 无 aom_node_process_number 进程数量 该指标用于统计测量对象上的进程数量。 ≥0 无 aom_node_gpu_temperature_centigrade 显卡温度 该指标用于统计显卡的温度。
日志分析 通过日志接入和日志搜索功能帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 支持 支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。
资源添加方式选择“动态资源”才会显示。 最多可以添加100条资源匹配规则。 - 资源类型 根据实际选择资源类型:集群、主机、应用、组件、实例、进程和容器。 说明: 资源添加方式选择“指定资源”才会显示。 集群 资源名称 展示勾选的资源名称。 说明: 资源添加方式选择“指定资源”才会显示。
scale_out_k8s、scale_out_vm表示扩容。 scale_in_k8s、scale_in_vm表示缩容。 含有k8s的表示容器应用,含有vm的表示进程应用。 parameters 是 参见表7 - 包含扩缩容的实例数。 表7 parameters字段数据结构说明 参数名称 是否必选 参数类型
环境标签,是在环境上的一个属性,多个环境可能具有相同的标签,可以通过标签对环境进行过滤。 选填 APM_INSTANCE_NAME instanceName 实例是环境下的一个进程,名称由主机名+ip+实例名称组成。 选填 监控Node.js应用(手动接入Agent) AOM提供应用接入功能,通过手动接入Agent来监控Node
FS,SFS TURBO,SMN,VPN,GeminiDB,AS,CloudTable,MRS,CBH,ER,GaussDB for MySQL,DCS,RDS,OBS,DMS,ELB,NAT,VPC,GaussDB DWS,LakeFormation,WAF,DRS,DDS,D
阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String 扩缩容:含有k8s的表示容器应用,含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型 描述 scale_unit
资源进行分析和管理。 目前支持对以下资源类型的管理: 云服务器ECS,数据库(关系型数据库RDS、数据复制服务DRS、云数据库GaussDB NoSQL、云数据库 GaussDB),网络(虚拟私有云VPC、弹性负载均衡器ELB、弹性公网IP EIP),应用中间件(分布式缓存DCS
查询标签值查询所有指标 namespace 是 String 指标命名空间。取值范围: PAAS.CONTAINER:组件指标、实例指标、进程指标和容器指标的命名空间, PAAS.NODE: 主机指标、网络指标、磁盘指标和文件系统指标的命名空间, PAAS.SLA:SLA指标的命名空间,
阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String 扩缩容:含有k8s的表示容器应用,含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型 描述 scale_unit
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 阈值规则
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 阈值规则
scale_in_k8s、scale_in_vm表示缩容。 scale_set_k8s、scale_set_vm表示设置应用实例个数。 含有k8s的表示容器应用,含有vm的表示进程应用。 parameters 是 参见表6 - 包含扩缩容的实例数 表6 parameters字段数据结构说明 参数名称 是否必选 参数类型
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 指标维度格式
多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。 高性能 相较开源版本结构更轻量,资源消耗更低。通过单进程一体化Agent监控Kubernetes集群,采集性能提升20倍。 Agent部署在用户侧,保留原生采集能力同时能够最大程度的减少资源的使用。