检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
登录CES控制台。 在左侧导航栏中选择“主机监控 > 裸金属服务器”。 云服务监控 云服务监控可收集云服务内置监控指标的数据,您可以通过监控这些指标来跟踪对应云服务状态。除了查看监控数据,您还可以在云服务监控页面创建告警规则和导出原始监控数据。 查看监控指标 在监控指标页面上,您可以查看基于近1小时、近3小时
√ 获取租户下CCE集群信息列表 √ √ 获取租户下某个CCE集群下的Agent信息列表 √ √ 给租户下某个CCE集群安装ICAgent √ x 给租户下某个CCE集群升级ICAgent √ x 给租户下某个CCE集群卸载ICAgent √ x 获取CCE集群列表 √ √ 获取ICAgent机器列表
基础设施监控 通过AOM监控工作负载 通过AOM监控集群 通过AOM监控主机 通过AOM监控进程 通过AOM监控云服务
不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。
ICAgent安装成功但是配置错误 ICAgent安装成功但是数据采集失败 解决方法 若ICAgent未安装成功,请重新安装ICAgent。 若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。
CCE容器场景自建中间件接入AOM实现指标监控 CCE容器场景自建中间件接入AOM方案概述 PostgreSQL Exporter接入AOM实现指标监控 MySQL Exporter接入AOM实现指标监控 Kafka Exporter接入AOM实现指标监控 Memcached Exporter接入AOM实现指标监控
在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
阈值规则:对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生阈值告警(阈值告警即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据不足事件即由阈值规则触发而产生的事件)。同时执行自定义的触发策略,当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,会以邮件或
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 约束与限制 配置的日志接入LTS规则可能会影响LTS中的日志数据,产生额外的费用,请谨慎操作。 配置接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤:
支持分别搜索“组件”、“系统”、“主机”日志。 组件日志支持设置“集群”、“命名空间”、“组件”等过滤条件,还可以通过“高级搜索”,设置“实例”、“主机”、“文件名称”、“隐藏系统组件”等过滤条件搜索日志。 系统日志支持设置“集群”、“主机”等过滤条件。 主机日志支持设置“集群”、“主机”等过滤条件。 在搜索文本框中输入关键词时,搜索规则如下:
Recording Rule配置完成后,可通过如下方式查看指标数据。 方式一:通过AOM的“指标浏览”页面查看配置了Recording Rule的Prometheus实例的指标数据。 方式二:通过Grafana查看AOM中的指标数据。 父主题: Prometheus监控
查看应用性能指标 应用概览页面展示应用维度的指标数据,包含url调用次数、url平均响应时间、url错误率等;同时支持“购买特惠包”以及“接入应用”。 查看应用性能指标 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请参见表1。如果“
区域生效。 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控
ICAgent属于插件,UniAgent不属于插件,二者不是同一个含义。 UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护
每秒网卡发送的数据包个数。 ≥0 个/秒(Packet/s) 总Bps(aom_node_network_total_bytes) 该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Byte/s) 表2 网络指标维度 维度 说明 clusterId 集群ID。 hostID
准确查看应用、服务器的指标数据。 ICAgent进程需要root用户安装和运行。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要
cms:job:list √ × 根据作业id查询方案(自定义模板)列表 POST /v1/{project_id}/cms/template-list/{job_id} cms:template:list √ × 获取方案信息 GET /v1/{project_id}/cms
过程中可能出现的异常问题。 数据源 源日志组 日志数据来源的日志组,请从下拉列表中选择。若下拉列表中没有合适的日志组,请单击“创建日志组”新建。 日志数据默认存储30天,可以在1-30天之间设置。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。 如
子类型 信息 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、应用环境、UniAgent状态、资源状态、操作。 云容器引擎CCE - 工作负载 负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 集群 集群名称、集群ID、区域。 数据库