检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
响应Body参数 参数 参数类型 描述 page Long 页码,默认1。 page_size Long 每页数量,默认20。 total_count Long 总数量。 data_list Array of AgentInfoResult objects 主机列表信息。 表4 AgentInfoResult
指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。 “平均值 > 1” 触发条件 连续多少个周期满足阈值条件后,触发指标告警。 3 告警级别 指标告警的级别。 :表示紧急告警。 :表示重要告警。 :表示次要告警。 :表示提示告警。
可能原因一:ICAgent问题 修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明ICAgent未安装或运行异常,可参考表1进行处理。 表1 ICAgent修复建议 状态 修复建议 未安装 主机未安装I
container_file_descriptors 容器打开的文件描述符数量 container_fs_inodes_free 文件系统的可用inode数量 container_fs_inodes_total 文件系统的总计inode数量 container_fs_io_time_seconds_total
参数名称 参数说明 触发条件 统计周期 指标数据按照所设置的统计周期进行聚合。默认只统计一个周期,最多可统计5个周期指标数据。 连续周期 连续多少个周期满足阈值条件后,发送阈值告警。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 阈值条件
、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 约束与限制 指标类告警规则触发的告警,默认持续时长为5天,超过5天将自动清除,转为历史告警。 操作步骤 登录AOM 2.0控制台。
显示此参数。 持续时间包括:立即、15秒、30秒、1分钟、2分钟、5分钟、10分钟、15分钟、1小时、6小时、12小时。 触发条件 连续多少个周期满足阈值条件后,触发指标告警。连续周期的取值范围为1~30。当前仅在选择“满足任意条件触发”的判断条件时,显示此参数。 例如,设置连续
${alarm_probableCause_zh} 附加信息 其他附加的告警描述信息,例如指标名称、告警规则状态的变化等。 ${message} 修复建议 修复建议,非自定义上报则展示"NA" ${alarm_fix_suggestion_zh} 自定义标注 标注扩展字段 $event.annotations
通用配置可以设置Agent字节码方式拦截,慢请求阈值、监控指标数据采集的最大行数以及前端监控聚合设置。 探针统计 支持对租户使用的探针数量进行统计,您可以从多个维度(时间、区域、探针类型)查看租户使用的探针数量。 回到旧版 登录AOM 2.0 控制台,在左侧导航栏选择“返回旧版”,即可跳转至AOM 1.0的相关功能服务界面,AOM
创建一个新主题,并为这个主题添加订阅。 执行策略 分批发布 选择是否开启分批发布开关,默认不打开。 每批发布 开启分批发布后需填写每批发布数量。 每批间隔 开启分批发布后需填写每批发布的时间间隔。 单击“立即执行”进入任务执行界面,查看任务执行情况。 也可单击“保存”,将创建好的
AOM日志中每天产生大量日志,怎样查看AOM中的日志是通过哪个应用产生的? 解决方法 AOM没有资源统计的功能,无法查看日志所属的应用。用户需要统计的话,建议将日志都接入到LTS,通过LTS的日志资源统计功能来统计。 具体的操作方法如下: 为应用创建对应的日志组和日志流。创建方法请参见:创建日志组和日志流。
的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码
触发告警或事件对应的具体资源。 ${resources} 自定义标签 标签扩展字段。 $event.metadata.key1 修复建议 修复建议,非自定义上报则展示"NA"。 ${alarm_fix_suggestion_zh} 自定义标注 标注扩展字段。 $event.annotations
≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。 触发条件 连续多少个周期满足阈值条件后,触发指标告警。连续周期的取值范围为1~30。 例如,设置连续周期为“2”,则表示连续2个周期满足检测规则的条件,触发指标告警。
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计
的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码
"1112222" } ] 响应示例 状态码: 204 OK 请求响应成功。 No Content 状态码: 400 BadRequest 非法请求。建议直接修改该请求,不要重试该请求。 { "error_code" : "AOM.08015002", "error_msg" : "the
node_processes_pids PID个数 node_sockstat_TCP_alloc 已分配的TCP套接字数量 node_sockstat_TCP_inuse 正在使用的TCP套接字数量 node_sockstat_TCP_tw 等待关闭的TCP连接数 node_timex_offset_seconds
"1112222" ] 响应示例 状态码: 204 OK 请求响应成功。 No Content 状态码: 400 BadRequest 非法请求。建议直接修改该请求,不要重试该请求。 { "error_code" : "AOM.08020006", "error_msg" : "The
说明 指标名 指标的名称。 指标类型 指标的类型,包含基础指标和自定义指标。 指标量(最近10分钟) 最近十分钟新存储的指标量。 占比 该指标数量在所有指标中的占比。 查看云服务类型Prometheus实例的指标 登录AOM 2.0控制台。 在左侧导航栏中选择“Prometheus监控