检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将数据上传到ECS服务器。 下载mysqld_exporter-0.14.0.linux-amd64.tar.gz软件包,下载地址:https://prometheus.io/download/。 以root用户登录ECS服务器,将下载的Exporter软件包上传到ECS服务器并解压。
服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 目前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持数据多写功能。 CCE类型的Prometheus实例中配置的预汇聚规则指标暂不支持数据多写。
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) NTP服务器状态(aom_node_ntp_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss.icAgent.trace | grep proxyworkflow
模板的描述信息,最多可输入1024个字符。 为模板添加监控的云服务及告警规则。 从下拉列表选择需要新增告警规则的云服务。 单击云服务名称页签,为对应云服务新增告警规则,详细的新增方式请参见表2。 图1 创建云服务的告警规则 表2 为云服务新增告警规则 云服务名称 告警规则类型 新增方式 Functi
按小时、按天、按月三种周期进行结算,应用运维管理的按需计费模式按天进行结算。具体扣费规则可以参考按需产品周期结算说明。 例如:按天结算的云服务器在2023/06/18 8:30删除资源,但是2023/06/18 8:00~9:00期间产生的费用,通常会在2023/06/19 0:00:00才进行扣费。
请耐心等待。 安装失败 主机ICAgent安装失败,请登录服务器卸载后重新安装。 升级中 正在为主机升级ICAgent,升级ICAgent预计需要1分钟左右,请耐心等待。 升级失败 主机ICAgent升级失败,请登录服务器卸载后重新安装。 离线 AK/SK配置不正确或30200、
时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length HTTP协议标准报头。用于指明实体正文的长度,以字节方式存储的十进制数字来表示。
用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。 cat /var/ICAgent/oss.icAgent.trace | grep
AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统(AOM支
可以将维度理解为这些特征的类别。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统,且主机已
可以通过提交工单,为您开放此功能。 AOM 2.0融合CES相关功能后,会向AOM FullAccess策略中添加“CES:*:*”,“ecs:instance:list”,“dms:instance:list”,“dms:instance:get”,“lts:topics:li
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
管理采集器底座UniAgent 安装UniAgent 安装UniAgent(新版) 管理主机的UniAgent 管理主机的ICAgent插件 管理CCE集群的ICAgent插件 管理主机组 管理主机组(新版) 配置代理区域和代理机 查看操作日志 父主题: 接入AOM(新版)
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
Prometheus实例 for ECS ECS 通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。 适合需要对运行在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS集群)的应用组件进行监控场景
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
Exporter) Prometheus 运行环境接入 云容器引擎 CCE (ICAgent) 指标 运行环境接入AOM 云容器实例 CCI 弹性云服务器 ECS Prometheus 云服务接入 弹性伸缩AS、函数工作流 FunctionGraph、云硬盘 EVS、云备份 CBR、对象存储服务
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及