检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes) 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) 表2 磁盘指标维度 维度 说明 clusterId
深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。
/v1/{project_id}/ams/metricdata 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 fillValue 否 String
0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。 图1 选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成
0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。 图1 选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成
表6 数字折线图图表配置说明 参数名称 说明 是否拟合为曲线 开启该功能后,将折线的连接点拟合为平滑曲线。 是否显示图例 开启该功能后,显示折线的图例。 隐藏X轴 开启该功能后,隐藏X轴。 隐藏Y轴背景线 开启该功能后,隐藏Y轴背景线。 是否显示点 开启该功能后,显示折线的连接点。 日志数据类图表
创建DMS实例”创建。 验证DMS实例连通性。 数据订阅至DMS需要在IAM委托界面增加名为“apm_admin_trust”委托,请确认是否已经创建。创建“apm_admin_trust”委托的详细操作请参见如何创建委托apm_admin_trust。 输入DMS用户名和密码。
维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。
AOM展示的日志是否为实时日志? AOM展示的日志为近实时日志,日志存在秒级时延。 日志从采集上报到处理需要一定的时间,日志量较小时日志会存在10秒左右的时延,日志量特别大时时延会更长。 父主题: 日志分析
在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进程状况、应用性能(错误数、请求数、平均响应时间)、告警分
自动选择为跳转前“指标浏览”界面的配置。 删除指标 在需要删除的指标项后单击。 添加指标图表到仪表盘 选择指标后,在指标列表右上方单击。 是否显示区域 开启该功能后,使用折线图监控指标时,指标数据在图表中显示背景色。 监控日志 AOM可以对日志数据进行监控分析,首先您需要对日志进行结构化配置,具体请参考结构化配置。
告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 告警方式 直接告警:满足告警条件,直接发送告警。选择直接告警方式,需要设置通知频率和是否启用告警行动规则(通知规则)。 通知频率:发送告警通知的频率,请根据需要从下拉列表中选择。 启用告警行动规则(通知规则)后,系统根据关联S
指标配置 “指标采集开关”用来控制是否对指标数据进行采集(自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理
p_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接 无 NTP同步状态(aom_node_ntp_status) 该指标用于统计主机本地时间与NTP服务器时间是否同步。 0、1 0表示同步 1表示未同步 无 进程数
ead_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_container_disk_write_kilobytes) 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) 文件系统可用(aom_co
aom_node_disk_read_kilobytes 磁盘读取速率 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) aom_node_disk_write_kilobytes 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) 磁盘分区指标 aom_host_
均响应时间是否有异常突增点。 TopN接口平均响应时间突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top 5接口平均响应时间是否有异常突增点。 应用服务整体错误率突增:基于应用历史3小时数据,判断最近10分钟应用服务整体错误率是否有异常突增点。
diskReadRate 磁盘读取速率 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) aom_node_disk_write_kilobytes diskWriteRate 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) GPU aom_n
配置AOM全局开关 AOM支持配置如下全局开关: 指标采集开关:用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 告警消息内容显示资源的TMS标签:用来控制告警通知的消息内容是否显示不同云资源的标签。 约束与限制 全局开关针对整个AOM 2.0服务生效。 开启“告警