检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指标配置 “指标采集开关”用来控制是否对指标数据进行采集(自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。
购买云主机(必选) 每一台主机对应云上的一台虚拟机(例如:弹性云服务器ECS)或物理机(例如:裸金属服务器BMS)。主机可以在ECS、BMS直接购买,也可以通过CCE间接购买。 安装ICAgent(必选) ICAgent是AOM的采集器,用于实时采集指标、日志和应用性能数据。
配置管理 配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。 UniAgent管理 UniAgent相关API,包括下发批量安装,升级UniAgent任务,以及查询UniAgent主机列表接口。
操作步骤 非华为云上的服务器安装ICAgent,请先在华为云上购买一台弹性云服务器作为跳板机,然后执行如下操作: 推荐CentOS 6.5 64bit及其以上版本的镜像, 最低规格为1vCPUs | 1GB,推荐规格为2vCPUs | 4GB。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。
使用Prometheus监控ECS主机的指标 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、可靠的云上环境
弹性云服务器创建成功后,您就可以像使用自己的本地PC或物理服务器一样,在云上使用弹性云服务器。
弹性云服务器创建成功后,您就可以像使用自己的本地PC或物理服务器一样,在云上使用弹性云服务器。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案
适合需要对运行在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS集群)的应用组件进行监控场景,可以通过接入中心添加Prometheus中间件及自定义插件监控。 Prometheus实例 for 云服务 多种云服务 提供多种云服务的监控。
ECS类型Prometheus实例的指标数据不支持展示资源类型。 指标量(最近10分钟) 最近十分钟新存储的指标量。 云服务类型Prometheus实例的指标数据不支持展示最近十分钟新存储的指标量。 占比 该指标数量在所有指标中的占比。
第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 应用场景 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。
DCS、专享版API网关 APIG、云数据库 GaussDB(for MySQL)、云数据库 GeminiDB、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务 DRS、AI平台 ModelArts、湖仓构建 LakeFormation、表格存储服务 CloudTable、MapReduce
文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。
资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标,集群->虚机->应用->容器异常关联分析。 图2 立体化运维
类型为String,event为普通告警,alarm为告警事件; resource_provider:事件对应云服务名称。类型为String; resource_type:事件对应资源类型。类型为String; resource_id:事件对应资源信息。类型为String。
操作步骤 非华为云上的服务器安装ICAgent,请先在华为云上购买一台弹性云服务器作为跳板机,然后执行如下操作: 推荐CentOS 6.5 64bit及其以上版本的镜像, 最低规格为1vCPUs | 1GB,推荐规格为2vCPUs | 4GB。
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。
可靠的云上环境。