检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss.icAgent.trace | grep proxyworkflow
)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集。 ICAgent:ICAgent插件主要是作为AOM和LTS的采集端,用于指标采集和日志采集。 图1 ICAgent和UniAgent概述图
取值范围:0min-15day,推荐设置为1h。 步骤二:创建全量指标告警规则 通过指标告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 按照配置方式的不同,创建指标告警规则可分为两种:按全量指标创建和按Prometheus命令创建。下
r性能分析页签。 图1 性能分析 在Profiler页签选择您想要查看的实例、性能分析类型、范围以及聚合维度,可以查看该实例对应的性能分析数据。 表1 性能分析参数说明 选择项 参数 说明 类型 CPU Time 每个方法在CPU上的运行时间。 类型 Memory 每个方法分配的堆内存大小。
smn_request_id String 请求smn服务的请求id。 最小长度:32 最大长度:32 smn_response_body String 调用smn服务返回的信息。 最小长度:0 最大长度:1024 smn_response_code String 调用smn服务返回的http状态码。 最小长度:3
ICAgent管理(非华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
”进行切换操作。您需要注意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
删除工作负载 workload deleteWorkload 更新工作负载 workload updateWorkload 上报ECS主机信息 ecs aomImportECS 资源监控 创建仪表盘 dashboard updateDashboard 删除仪表盘 dashboard deleteDashboard
统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。
1,默认值是1(用户不传,值是1)。 最小值:1 最大值:1000 page_size 否 Integer 每页显示的条数,每页查询的总条数,page_size为正整数,不能是0和负数,当输入参数为负数,0和大于101,自动修正参数为10,默认值是10(用户不传时,值是10)。 最小值:1
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
Prometheus监控 如何将Prometheus数据接入到AOM? Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标?
timeRange用于指标查询时间范围,主要用于解决客户端时间和服务端时间不一致情况下,查询最近N分钟的数据。另可用于精确查询某一段时间的数据。 如: -1.-1.60(表示最近60分钟),不管当前客户端是什么时间,都以服务端时间为准查询最近60分钟。 1650852000000.1650852300000
其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决办法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址
故障传播链分析:提供基于应用性能管理APM平台的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 优势 从周期性、稳定性和自相关性等多维度对数据进行特征提取,自动检测指标异常。 基于应用服务和流量Top
户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的自动化运维权限,并结合实际需求进行选择。若您需要对除自动化运维之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。
反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规则支持关键词统计和SQL统计。两者的区别
矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。 图1 通过柱状图查看统计数据 将鼠标移至矩形块,提示信息显示了该矩形块代表的时间范围(起始时间和结束时间)及该时间范围内满足查询条件的日志条数。单击矩形块(单击,可取消