检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Exporter,即可采集Linux类型主机节点的相关信息和运行指标,具体操作请参见配置弹性云服务器 ECS接入AOM。 配置弹性云服务器 ECS接入AOM Node Exporter是Prometheus官方提供的exporter,主要用来采集Linux类型节点的相关信息和运行指标,包括主机的CPU、内存
管理指标接入和日志接入 在接入中心完成指标接入AOM以及日志接入LTS后,您可以在接入管理页面管理相关的指标接入规则和日志接入规则。 约束与限制 接入管理功能区分新旧版,如果您进入的是旧版接入管理页面,需使用新版接入管理功能,可在“接入中心”页面右上角单击“体验新版”,切换为新版
、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 ICAgent进程需要root用户安装和运行。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceSta
也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。 此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。 取值范围
”计费。 欠费影响 华为云根据客户等级定义了不同客户的宽限期和保留期时长。充值的详细操作请参见账户充值。 欠费预警 系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时,我们将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 欠费后影响 当您的账号
实例列表”,然后单击“创建Prometheus实例”。 设置实例名称、企业项目,和实例类型信息。 表1 创建Prometheus实例 参数名称 说明 实例名称 Prometheus实例的名称。 只能由中文、字母、数字、下划线、中划线组成,且不能以下划线或中划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。
变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。此处的变化是指新增告警或告警状态改变。 60秒 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。 1小时 单击“立即创建”。 步骤二:创建全量指标告警规则
机接入到AOM中进行监控。 日志 AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对应的日志存储时长、大小和计费方式不同,详见收费详情。 日志流量 日志流量指的是每秒上报的
us-stack处于“运行中”状态时,才能成功启用/停用采集规则。 查看kube-prometheus-stack插件状态的方法:登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“插件中心”,在右侧找到“云原生监控插件”卡片,查看插件的状态。 新增ServiceMonitor
application/json;charset=utf-8 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 响应消息 响应参数 响应参数如表3所示。 表3 响应参数 参数名称 参数类型 描述 errorCode
云服务监控可收集云服务内置监控指标的数据,您可以通过监控这些指标来跟踪对应云服务状态。除了查看监控数据,您还可以在云服务监控页面创建告警规则和导出原始监控数据。 查看监控指标 在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。
日志采集规则修改:指定日志采集文件名时不受日志文件扩展名(.log、.trace和.out)限制;被采集日志文件必须为文本文件。 2019-8-30 容器指标增加对“文件系统可用”“文件系统容量”和“文件系统使用率”的支持。 主机和容器指标增加对NPU指标的支持。 2019-8-21 支持统计分
划线、中划线。 描述 规则的描述信息。 启用状态 该开关默认开启,表示实时更新任务运行状态。关闭后,任务列表中任务的运行状态会延迟2分钟更新。 委托授权 执行此任务需要授权的委托,系统默认勾选。 创建日志生成指标任务,需要您授权LTS和AOM创建云服务委托:lts_admin_t
输入搜索条件,在实例列表中通过搜索条件来选取实例,默认按照名称搜索。 过滤条件 输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条件,搜索时多个过滤属性之间为“与”的关系。 该方式对未来新增的实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。
也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。 此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。 取值范围
y_megabytes) 总的磁盘空间容量。 ≥0 兆字节(MB) 磁盘读写状态(aom_node_disk_rw_status) 该指标用于统计主机上磁盘的读写状态。 0、1 0表示读写 1表示只读 无 磁盘使用率(aom_node_disk_usage) 已使用的磁盘空间占总的磁盘空间容量百分比。
响应参数 无 请求示例 删除消息通知模板名称为aaa的消息通知模板 https://{Endpoint}/v2/{project_id}/events/notification/templates { "names" : [ "aaa" ] } 响应示例 无 状态码 状态码 描述
gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。 0~100 百分比(%) 容器状态 aom_container_status status 容器状态 该指标用于统计容器的状态。 ≥0 无 进程指标 CPU aom_process_cpu_usage cpuUsage CPU使用率
存使用率的平均值。趋势图上方的值为最新时间点所有集群的CPU使用率的平均值和所有集群的内存使用率的平均值。 应用监控卡片 图2 应用监控 此卡片主要展示应用监控的指标数据。 应用、组件、容器和实例的运行状态。 选择一个应用,可呈现该应用的如下信息: 近30分钟网络流量数据的趋势图
应用监控 应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置