检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ICAgent版本说明 表1 ICAgent版本说明 版本号 说明 5.12.135 解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。
默认开启以下服务发现能力:Kubernetes SD、 ServiceMonitor、PodMonitor的自定义发现。 适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。 Prometheus实例 for ECS ECS 通过在VPC内的某台虚机上安装uniagent(
添加日志转储 AOM支持将日志转储到对象存储服务(Object Storage Service,简称OBS)的OBS桶中,以便进行长期存储。如果您有更长时间的日志存储需求,可添加日志转储。 AOM提供周期性转储和一次性转储两种转储方式,供您选择使用。 周期性转储:将当前日志实时转
维度 说明 clusterId 集群ID。 clusterName 集群名称。 gpuName GPU名称。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。
系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。 表1 系统指标命名空间 命名空间名称 说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。
体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。 故障快速诊断:分布式调用追踪,快速找到异常故障点。 资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标,集群->虚机->应用->容器异常关联分析。 图2 立体化运维
基于CMDB模型,从应用、组件到环境对资源健康状态分层监控。 部分支持 不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标
来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数
接口调用 接口调用主要是对外部服务调用当前应用程序进行监控。主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监控、Functiongraph监控。这个类型的监控项决定整个服务实际的对外状态。比如某个URL的平均响应时间较长时,外部用户在界面看到数据的时间就较长。
该字段内容填为“application/json;charset=utf-8”。 必选 application/json;charset=utf-8 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 响应消息 响应参数 响应参数如表3所示。
Prometheus实例、卸载托管Prometheus实例等接口。 配置管理 配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。 应用资源管理(仅适用AOM 2.0) 应用资源管理相关API,包括新增、修改、查询、删除应用等接口。 自动化运维(仅适用AOM
nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。 ≥0 次 nacos_longPolling Nacos
系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。 表1 系统指标命名空间 命名空间名称 说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。
原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决办法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish
说明 示例 转储文件形式 包括自定义文件和日志桶。 自定义文件 转储方式 包括一次性转储和周期性转储。 周期性转储 筛选条件 可按照日志类型、集群名称、命名空间等多个维度对日志进行筛选,以便将满足条件的日志进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日
11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 ≥0 兆字节(MB) aom_container_filesystem_capacity_megabytes 文件系统容量 该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 PromQL Prometheus监控的查询语言。支持瞬时查询和时间跨度查询,内置多种
(ksoftirqd/0) 1140 tuned Tue Oct 2 21:12:27 2018 /usr/bin/python -Es /usr/sbin/tuned -l -P 1144 sshd Tue Oct 2 21:12:27 2018