检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“Profiler性能分析”,切换至Profiler性能分析页签。 单击“对比”,进入对比页面。 图1 对比 在对比页签选择您想要查看的实例、性能分析类型、范围、聚合维度以及对比类型,可以查看该实例对应的性能分析数据,详细参数说明请参见表1 对比参数说明。 您还可以根据需要执行以下操作: 对比对象:和分别支持不同实例,或相同实例不同时间段。
单击已接入的集群名称,进入该集群的管理页面。 执行以下操作完成Exporter部署。 使用Secret管理PostgreSQL密码。 在左侧导航栏中选择“工作负载”,在右上角单击“YAML创建”完成YAML配置。YAML配置说明:使用Kubernetes的Secret来管理密码并对密码进行加密处理,在启动PostgreSQL
Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 Remote Read配置 推荐配置 prometheus.yml。具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
单击已接入的集群名称,进入该集群的管理页面。 执行以下操作完成Exporter部署。 使用Secret管理PostgreSQL密码。 在左侧导航栏中选择“工作负载”,在右上角单击“YAML创建”完成YAML配置。YAML配置说明:使用Kubernetes的Secret来管理密码并对密码进行加密处理,在启动PostgreSQL
参数说明 触发条件 统计周期 指标数据按照所设置的统计周期进行聚合。默认只统计一个周期,最多可统计5个周期指标数据。 连续周期 连续多少个周期满足阈值条件后,发送阈值告警。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 阈值条件 阈
Prometheus实例名称不能重复。 修改Prometheus实例相关配置 在Prometheus实例列表中,单击云服务、CCE、多账号聚合类型的Prometheus实例的实例名称,可根据需要修改对应接入云服务、接入CCE集群、接入账号信息。 删除Prometheus实例 选择
指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 统计周期 指标数据按照所设置的统计周期进行聚合。 统计周期与统计时段相关联,选择的时段不同,统计周期的显示也会相应变化,具体说明请参见时间范围和统计周期的关系。 统计时段 指标数据按照所设置的时间范围进行聚合。设置时间
系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控CCE的工作负载信息,则单击“cce-workload-template”,并在仪表盘监控页面选择需要监控的组件ID。还可对仪表盘执行表1中的操作。 更多操作
云服务、Prometheus for ECS、Prometheus for CCE、Prometheus 通用实例、Prometheus for 多账号聚合实例、default。 刷新方式 过滤器刷新的方式。目前只支持选择“On dashboard load”,在仪表盘刷新时刷新过滤器。 指标名称
加环境。 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加日志接入页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 注意事项 如需使用“日志接入”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。 当
组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 主机 AOM的每一台主机对
指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无 flink_jobmanager_Status_JVM_CPU_Time jobmanager中JVM使用的CPU时间。 无 fl
正则表达式的输入请参见正则表达式输入说明。 单击,通过AND、OR关键词可为同一指标设置多个监控条件。 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。包括:不分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by cluste
正则表达式的输入请参见正则表达式输入说明。 单击,通过AND、OR关键词可为同一指标设置多个监控条件。 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。包括:不分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by cluste
本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入Uniagent
QL语句,单击“查询”搜索。 目前支持的SQL语句详见SQL查询语法。 SQL查询约束有: 单次查询返回结果最多10W条。 当聚合结果超过10W时,聚合结果可能存在误差。 SQL查询语句中,string类型的where条件的键值有限制: 精确查找value需添加英文单引号, 模糊
参数说明 触发条件 统计周期 指标数据按照所设置的统计周期进行聚合。默认只统计一个周期,最多可统计5个周期指标数据。 连续周期 连续多少个周期满足阈值条件后,发送阈值告警。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 阈值条件 阈
SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PROF_DRAM_ACTIVE)情况下,更高的占用率表示更有效的GPU使用率。 0~1.0 占比(Fraction)
正则表达式的输入请参见正则表达式输入说明。 单击,通过AND、OR关键词可为同一指标设置多个监控条件。 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。包括:不分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by cluste
节点fork总数 node_intr_total 节点中断总数 node_load1 节点1分钟CPU负载 node_load15 节点15分钟CPU负载 node_load5 节点5分钟CPU负载 node_memory_Buffers_bytes 节点缓冲区的内存 node_memory_Cached_bytes