检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
√ 获取租户下CCE集群信息列表 √ √ 获取租户下某个CCE集群下的Agent信息列表 √ √ 给租户下某个CCE集群安装ICAgent √ x 给租户下某个CCE集群升级ICAgent √ x 给租户下某个CCE集群卸载ICAgent √ x 获取CCE集群列表 √ √ 获取ICAgent机器列表
主要提供工作负载监控、集群监控、主机监控、进程监控和云服务监控的功能。 工作负载监控 工作负载监控的对象通过CCE部署的工作负载,通过工作负载监控可及时了解工作负载的资源使用、状态和告警等信息。 集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控展示集群的Pods运行状态、CPU使用率等信息。
如果需要将CCE的工作负载上报到AOM中,并挂载到“应用监控”页面左侧的应用树中以组件形式体现,需要先升级工作负载。具体操作如下: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。 在该工作负载对应的“操作”列中选择“更多 > 编辑YAML”。
选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。 添加白名单权限。 单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。 创建终端节点。
bind_notification_rule_id 否 String 绑定的告警行动规则名称。 related_cce_clusters 否 String CCE集群id。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。
≥0 兆字节(MB) 表2 进程指标维度 维度 说明 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 nameSpace 集群的命名空间。 processID 进程ID。 processName 进程名称。 serviceID 存量ID。
指标管理 配置指标 配置CCE集群指标管理 父主题: Prometheus监控
服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName 容器名称。 deploymentName k8s Deployment名称。 kind 应用类型。 nameSpace 集群的命名空间。 podID
该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Byte/s) 表2 网络指标维度 维度 说明 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。 父主题:
已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加日志接入页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 注意事项 如需使用“日志接入”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。
指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置Prometheus监控的采集规则,来监控部署在CCE集群内的业务数据。 当前仅Prometheus for CCE 实例支持。 配置指标 支持查看、新增和废弃指标。 当前仅default类型、C
(ksoftirqd/0) 1140 tuned Tue Oct 2 21:12:27 2018 /usr/bin/python -Es /usr/sbin/tuned -l -P 1144 sshd Tue Oct 2 21:12:27 2018
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
AOM四层指标体系 前提条件 已将ELB日志接入LTS。 已为环境关联ECS资源。 步骤一:建设四层指标体系 接入业务层指标。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 在右侧“业务层”面板单击需要接入的指标卡片。 接入ELB 日志指标 系统可自动接入,无需用户手动操作。
资源添加方式选择“动态资源”才会显示。 最多可以添加100条资源匹配规则。 - 资源类型 根据实际选择资源类型:集群、主机、应用、组件、实例、进程和容器。 说明: 资源添加方式选择“指定资源”才会显示。 集群 资源名称 展示勾选的资源名称。 说明: 资源添加方式选择“指定资源”才会显示。 arm-test-77169
参数 描述 是否为必选 示例 ResourceType 资源类型 必选 默认值为app,app表示给应用修改策略组属性 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 请求参数 请求参数如表3所示。
创建日志指标规则 基础设施监控 AOM提供基础设施监控功能,可以对工作负载、集群、主机、进程与云服务进行监控。通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息;提供集群监控可实时监控集群的多项基础监控指标和相关的告警、事件数据;通过主机监控您可以及时了解主机的资
组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数据的汇报展示,其中默认展示资源Top5,放大图表后展示资源Top15。
来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数
行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要手动安装ICAgent,只需要在创建集群或部署应用时进行操作。 安装方式见表1: 表1 安装方式 方式 适用场景 首次安装 当满足以下条件时,您需要按照该方式安装: