检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
9.0.0 64bit Kylin Kylin V10 SP1 64bit 对于Linux x86_64服务器,AOM支持上表中所有的操作系统及版本。 对于Linux ARM服务器,CentOS操作系统仅支持7.4 及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制
Exporter可供使用,具体请参见Exporter详情。 Target Prometheus探针要抓取的采集目标。采集目标暴露自身运行、业务指标,或者代理暴露监控对象的运行、业务指标。 Job 一组Target的配置集合。定义了抓取间隔,访问限制等作用于一组Target的抓取行为。 Prometheus
接口调用 接口调用主要是对外部服务调用当前应用程序进行监控。主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监控、Functiongraph监控。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。 优势 应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。 跨云服务的分布式应用
age、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。
击对应作业右侧的“执行方案”,单击待发布成服务的方案所在行操作列的“发布成服务”。 图9 发布成服务 填写基本信息,单击“确定”发布。具体的参数说明请参见表6。 图10 发布成服务信息 表6 发布成服务参数 参数名称 说明 服务名 服务名称,最多可输入64个字符,只能包含大小写字母、数字、下划线、中划线和中文。
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 使用限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。
日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警数据到Kafka队列中,可从分布式消息服务的Kafka队列中获取消费日志或阈值告警数据。分布式消息服务Kafka版-价格说明 应用性能管理:AOM集成了应用性能管理服务(简称APM),方便提供更高级的运维能力。APM-价格说明
事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。
故障传播链分析 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 功能入口 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。
y和Skywalking。 前提说明 部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。 例如,以检查华北-北京四区域,且接入方式选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) NTP服务器状态(aom_node_ntp_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
敬请期待。 您可通过接入管理生成的认证凭据access_code,将原生Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据
统计资源消耗 通过Prometheus监控服务将指标数据上报到AOM后,即可在“资源消耗”界面查看上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for ECS Prometheus实例
访问管理 AccessCode是调用API的身份凭据。通过创建AccessCode可为当前用户配置API服务的调用权限。该权限设置针对整个AOM 2.0服务生效。 注意事项 每个用户最多可创建2个AccessCode。 创建AccessCode 登录AOM 2.0控制台。 在左侧
Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,执行以下命令检查Nginx是否已经启用stub_status模块(一般在/usr/loca