检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish
修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。 在CCE界面检查服务是否已被停止或删除。 通过应用发现功能发现的应用,当
搜索同时包含start和unexpected的日志数据:start && unexpected。 搜索同时包含start和unexpected的日志数据:start AND unexpected 或者 start and unexpected。 搜索包含start或者unexpected的日志数据:start ||
Float 阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String 扩缩容:含有k8s的表示容器应用,含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型 描述 scale_unit
prom_spec_config PromConfigModel object Prometheus实例所属特定配置。 cce_spec_config String Prometheus实例所属CCE特殊配置。 prom_limits PromLimits object Prometheus实例限制
参数类型 描述 no_data_timeframe 否 Integer 无数据周期的个数。 no_data_alert_state 否 String 数据不足时,阈值规则的状态。 “no_data”:数据不足并发送通知 “alerting”:告警 “ok”:正常 “pre_state”:保持上一个状态
String 指标名称。 namespace String 命名空间。 unit String 指标单位。 表10 Dimension 参数 参数类型 描述 name String 维度名称。 value String 维度取值。 请求示例 通过namespace+appName+clusterName查询指标列表。
阈值条件 表6 actions字段数据结构说明 参数名称 是否必选 参数类型 取值范围 描述 type 是 String scale_out_k8s scale_out_vm scale_in_k8s scale_in_vm scale_out_k8s、scale_out_vm表示扩容。
Float 阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String 扩缩容:含有k8s的表示容器应用,含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型 描述 scale_unit
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
是 String "maximum","minimum","average", "sum","sampleCount" 统计方式 namespace 是 String - 命名空间 metricName 是 String 取值满足表达式[a-zA-Z_:][a-zA-Z0-9_:
是 String "maximum","minimum","average", "sum","sampleCount" 统计方式 namespace 是 String - 命名空间,此参数在后台将以添加阈值规则时传入的值保存,此处传入的值不能将其修改。 metricName 是 String
Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 您可以使用本文档提供的API对应用运
)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集。 ICAgent:ICAgent插件主要是作为AOM和LTS的采集端,用于指标采集和日志采集。 图1 ICAgent和UniAgent概述图
组件与基础设施关联分析设置 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus for CCE实例,并在Prometheus实例中一键接入容器监控。 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus
String scale_out_k8s scale_out_vm scale_in_k8s scale_in_vm scale_set_k8s scale_set_vm scale_out_k8s、scale_out_vm表示扩容。 scale_in_k8s、scale_in_vm表示缩容。
在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets) 每秒网卡接收的数据包个数。 ≥0 个/秒(Packet/s) 下行错包率(aom_node_network_receive_error_packets) 每秒网卡接收的错误包个数。
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”