检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据
示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 指标配置”。 根据需要开启或者关闭“指标采集开关”和“告警消息内容显示资源的TMS标签”开关。
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
配置Grafana数据源参数。 URL:将URL设置为3.c获取的HTTP URL信息。 User:将User设置为3.c获取的用户名信息。 Password:将Password设置为3.c获取的密码信息。 Auth下Basic auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置
Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选)
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。 “日志采集
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
时区 定时任务的时区,可以在下拉列表中选择正确的时区。 执行策略 定时任务的执行策略,包含以下三种: 单次执行:在设置的时间执行一次操作。 简单周期执行:根据设置的时间周期循环执行。 周期执行(Cron表达式):根据设置的Cron表达式执行操作。 执行时间 定时任务执行的具体时间。 执行周期
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
主机监控 主机监控是针对主机的监控,通过主机监控您可以及时了解主机的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证主机流畅运行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。
间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 阈值规则 (非洲-约翰内斯堡、拉美-墨西哥城一
柱状图展示了满足2中已设查询条件的日志条数在时间上的分布。横轴显示时间,并对横轴进行30等分,即将横轴均分为30个矩形块,每个矩形块表示的时间为已选择的时间范围/30,例如,时间范围选择近30分钟,则每个矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。
ELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。 对于管理员创建IAM用户接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写。 accountid为IAM用户所属的账号ID。 username为要创建的IAM用户名。
本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件,虽然能采集很多指标,但却分散在各处,无法统一展示。
如图5所示,单击规则名称前的,可查看该告警规则的详细信息。 在展开的列表中,只要监控对象满足设置的告警条件时,在告警列表界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。只要当前示例使用的DCS实例的CPU利用率指标满足已设的通知策略,系统就会以邮件、短信或企业微信等方式发送告警通知给指定人员。
事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形成动态上界,以比对近10分钟的数据是否有异常。支持如下事件类型:
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入采集管理器Uniagent 本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。