检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内
String 指标名称。 namespace String 命名空间。 unit String 指标单位。 表10 Dimension 参数 参数类型 描述 name String 维度名称。 value String 维度取值。 请求示例 通过namespace+appName+clusterName查询指标列表。
lCount NB数据上报总数 统计当前实例/资源空间下NB数据上报总次数 ≥0 次 iotda_south_dataReport_successCount NB数据上报成功次数 统计当前实例/资源空间下NB数据上报成功次数 ≥0 次 iotda_south_dataReport_failedCount
安装并启动Grafana,具体操作请参见Grafana官方文档。 添加AccessCode。 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,
子菜单 功能说明 集成中心 AOM集成容器服务CCE集群的Prometheus云原生监控插件,支持在Prometheus实例的“集成中心”为CCE集群安装云原生监控插件,上报指标到指定的CCE类型Prometheus实例中。 当前仅CCE类型Prometheus实例支持。 接入中心
成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查30200、30201端口的连通性。
'https://aom-internal-access.{region_name}.{Site domain name suffix}:8443/v1/{project_id}/push' 公网Remote Write地址为: url: 'https://aom-access.{region_name}
1。当开始时间与结束时间都设置为-1时,系统会将结束时间设置为当前时间UTC毫秒值,并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如:-1.-1.60(表示最近60分钟) 约束: 单次请求中,查询时长与周期需要满足以下条件:
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM
本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指标存储时长功能受限
ensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_name可以在主机指标中查看,集群ID和节点ID各自对应的name可以在主机指标-维度中查看,namespace可以在表4 QuerySeriesOptionParam中查看。
进行安装。 请确保已安装ICAgent的服务器可以使用root用户执行SSH、SCP命令,来与待安装ICAgent的服务器进行远端通信。 当显示“ICAgent install success”时,表示安装成功,ICAgent已安装在了/opt/oss/servicemgr/目录
请求id。 请求示例 通过namespace+metric_name查询系统当前可监控的时间序列列表 https://{Endpoint}/v2/{project_id}/series { "series" : [ { "namespace" : "PAAS.CONTAINER"
如果需要在AOM控制台中使用CCE的功能,需提前获取CCE的相关权限,详情请参见CCE权限管理。 通过AOM监控集群 登录AOM 2.0控制台。 在左侧导航栏中选择“基础设施监控 > 集群监控”。 在页面右上角设置集群信息的统计条件。 设置时间范围,查看已设时间范围内上报的CCE集群,您可以使
etheus,可以忽略该步骤。) 添加AccessCode。 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,
true }, "CCE" : { "role_name" : [ "CCE FullAccess" ], "status" : true }, "CCI" : { "role_name" : [ "CCI FullAccess" ], "status"
依赖系统权限 AOM FullAccess AOM管理员权限,拥有该权限的用户可以操作并使用AOM。 系统策略 CCE Administrator、OBS Administrator、LTS FullAccess AOM ReadOnlyAccess AOM只读权限,拥有该权限的用户仅能查看AOM数据。
占比(Fraction) DCGM_FI_PROF_SM_OCCUPANCY SM Occupancy 表示在一个时间间隔内,驻留在SM上的线程束与该SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作
、主机等指标数据的场景。 Prometheus实例 for CCE CCE 提供与容器服务原生的集成能力、容器指标的监控能力。 默认开启以下服务发现能力:Kubernetes SD、 ServiceMonitor、PodMonitor的自定义发现。 适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。
Prometheus监控概述 管理Prometheus实例 管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长