检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云容器引擎CCE - 工作负载 负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 集群 集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。
目前支持对以下资源类型的管理: 云服务器ECS、云容器引擎CCE,数据库(关系型数据库RDS、文档数据库DDS、数据复制服务DRS、云数据库GaussDB NoSQL、云数据库 GaussDB),网络(虚拟私有云VPC、弹性负载均衡器ELB、弹性公网IP EIP、NAT网关、虚拟专用网络
5.12.130 支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。 支持LTS的podlb域名的切换能力。 5.12.111 新增线程指标、修复“获取lvs磁盘分区指标失败”问题。
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。
containerID 容器ID。 containerName 容器名称。 deploymentName 工作负载名称。 kind 应用类型。 nameSpace 集群的命名空间。 podID 实例ID。 podIP 实例IP。 podName 实例名称。
可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。 标签:告警标识属性,由标签名和标签值构成,支持用户自定义。例如设置为:标签+aom_monitor_level+等于+infrastructure。
其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。
普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes node内存实际总量:aom_node_memory_total_megabytes
已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 添加接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤: 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 接入LTS”。 单击“添加接入规则”。 选择接入类型。
容器实例监控(CPU&内存)卡片 图6 容器实例监控(CPU&内存) 此卡片主要展示了4种信息: 统计最新时间前1分钟内的容器实例的CPU使用率、内存使用率在TOP5的实例信息。
默认开启以下服务发现能力:Kubernetes SD、 ServiceMonitor、PodMonitor的自定义发现。 适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。
问题描述 在CCE插件市场安装了Prometheus插件之后,Grafana无法展示监控数据。 可能原因 Grafana配置参数错误。 解决方法 登录云容器引擎控制台(旧版)。
应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。
自建K8S集群 K8S(Kubernetes)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序,提升应用程序的可靠性和扩展性。具体操作请参见:接入日志(LTS)。
您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要手动安装ICAgent,只需要在创建集群或部署应用时进行操作。
或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。
组件监控 组件即您部署的服务,包括容器和普通进程。 组件列表展示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。 组件监控 登录AOM 2.0控制台。
通过CCE的kube-prometheus-stack插件、自建K8s集群、ServiceMonitor、PodMonitor等多种方式采集上报指标,监控部署在CCE集群内的业务数据。 通过丰富的告警模板,帮助业务快速发现和定位问题。
日志文件未使用CCE提供的logPolicy轮转策略。 日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。
方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。