正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装。 AOM和LTS使用的ICAgent功能完全相同,ICAgent采集的指标数据均上报到AOM分析处理,日志数据则只能匹配系统中最新的日志采集配置。 例如,当前在
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用
您可快速查看组件实例或主机的日志文件,以便定位问题。 查看日志文件 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志文件”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志文件”页面。 在“日志文件”页面选择“组件”或“主机”页签并单击名称,在页面右侧的日志文件
主机监控 主机监控是针对主机的监控,通过主机监控您可以及时了解主机的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证主机流畅运行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。
面上准确查看应用、服务器的指标数据。 ICAgent进程需要root用户安装和运行。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不
批量操作其他插件 虚机接入将陆续支持其他各种类型插件的接入功能,您可以在虚机接入的主机列表界面,直接对主机进行批量插件安装、升级、卸载、启动、停止和重启操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。 操作步骤 登录AOM 2.0控制台。 在左侧栏选择“设置”,进入全局配置界面。
<100(例如,已打印90条日志),该日志之后已打印的日志条数 <99(例如,已打印80条日志),则该日志之前的90条和之后的80条日志会被作为上下文显示。 单击“导出本页”,可将已显示的日志上下文原始数据导出到本地。 为了保障租户主机和组件的正常运行,租户的主机上会运行部分系统提供的组件(例如,kube-d
Body,删除失败Response Body显示错误信息。 响应参数如表2所示。 表2 响应参数 参数名称 类型 描述 errorCode String 错误码 errorMessage String 详细信息 响应示例 无 错误码 表3 错误码 错误码 错误信息 处理措施 SVCSTG.PE
型。 采集日志文件的资源消耗 日志文件采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。 日志丢失 采集器使用多种机制保证日志采集的可靠性,尽可能保证数据不丢失,但在如下场景可能导致日志丢失。 日志文件未使用CCE提供的logPolicy轮转策略。
型。 采集日志文件的资源消耗 日志文件采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。 日志丢失 采集器使用多种机制保证日志采集的可靠性,尽可能保证数据不丢失,但在如下场景可能导致日志丢失。 日志文件未使用CCE提供的logPolicy轮转策略。
格式命令行。 说明: 单击告警规则详情后的,可以锁定告警规则详情中的内容。锁定后,您可以进行以下操作: 单击告警规则详情后的,解除锁定。 单击告警规则详情后的,复制普罗语句。 命令行输入的详细说明请参见普罗语句说明。 告警级别 指标告警的级别,包括: :表示紧急告警。 :表示重要告警。
体组件的错误率异常。单击“查看调用链”,可详细追踪错误率突增的原因。 图2 应用服务整体错误率突增 TopN接口平均响应时间突增:基于应用的调用链数据,针对接口粒度提供调用链响应时间分析,快速定位根因。 图3 TopN接口平均响应时间突增 TopN接口错误率突增:基于应用的调用链
状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。 对于获取用户Token所示的消息头,其
称”文本框中设置的阈值规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。 图1 选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条
60//冷却时间,应用的策略执行完后必须冷却该时间后才能继续执行下条策略 } } 错误码 表5 错误码 错误码 错误信息 处理措施 SVCSTG.PE.4031012 Failed to verify the project ID. 请检查对应的参数是否符合要求。 SVCSTG
kubelet_runtime_operations_errors_total 按操作类型列出的运行时操作错误的累积数 kubelet_runtime_operations_total 按操作类型列出的运行时操作的累积数 kubelet_volume_stats_available_bytes
"SVCSTG.PE.0", "errorMessage": "" } 错误码 表5 错误码 错误码 错误信息 处理措施 SVCSTG.PE.4001101 Invalid parameter. 请检查对应的参数是否符合要求。 SVCSTG.PE.4031012 Failed to
以将维度理解为这些特征的类别。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统,且主机已安装
是 Array of strings 删除的规则名称 响应参数 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String 错误码 最小长度:12 最大长度:12 error_msg String 错误信息 最小长度:0 最大长度:1024 error_type