检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不可删除与编辑。 除默认模板的消息字段外,消息模板还支持用户自定义字段,需用户在上报事件告警信息时在指定参数上传该字段,具体实现参考接口文档:API事件告警,对应参数见下方消息模板告警上报结构体。 自定义字段支持以JSONPath的方式取值,示例:$event.metadata.case1、$event
产品优势 兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。
系统指标:AOM提供的基础指标,例如:CPU使用率、CPU内核占用等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。
用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。同时,AOM开放统一API,支撑对接自研监控系统或者报表系统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT
个筛选条件: 事件名称:输入事件的名称。 事件ID:输入事件ID。 资源名称:输入资源的名称,当该事件所涉及的云资源无资源名称或对应的API接口操作不涉及资源名称参数时,该字段为空。 资源ID:输入资源ID,当该资源类型无资源ID或资源创建失败时,该字段为空。 云服务:在下拉框中选择对应的云服务名称。
个筛选条件: 事件名称:输入事件的名称。 事件ID:输入事件ID。 资源名称:输入资源的名称,当该事件所涉及的云资源无资源名称或对应的API接口操作不涉及资源名称参数时,该字段为空。 资源ID:输入资源ID,当该资源类型无资源ID或资源创建失败时,该字段为空。 云服务:在下拉框中选择对应的云服务名称。
日志搜索与分析: 日志搜索与分析(默认推荐) 日志搜索与分析(管道符方式-邀测) 日志应用 日志接入 日志接入功能支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。
管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 子服务名称 策略名称
致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。 AOM产品介绍 AOM快速入门 AOM成长地图 接入中心 AO
规则。具体操作请参见创建指标告警规则。 轮播仪表盘 在仪表盘列表单击待操作的仪表盘名称,在仪表盘页面右上角单击。具体操作请参见设置全屏模式在线时长。 仪表盘设置 在仪表盘列表单击待操作的仪表盘名称,在仪表盘页面右上角单击。具体操作请参见新增变量。 查询时间设置 在仪表盘列表单击待
应用服务整体错误率突增 TopN接口平均响应时间突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟平均响应时间是否有异常突增点。 图7 TopN接口平均响应时间突增 TopN接口错误率突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟错误率是否有异常突增点。
若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题
事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。
节点温度 Atlas 500小站节点温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) node_power node_power 节点功率 Atlas 500小站节点功率,由用户调用edgecore接口上报。 ≥0 瓦(W) node_voltage node_voltage
单击事件卡片或列表进入该事件详情页面,查看事件的故障传播链。 支持查看故障传播链的异常事件类型包括: 应用服务整体平均响应时间突增 TopN接口平均响应时间突增 应用服务整体错误率突增 TopN接口错误率突增 通过故障转播图谱定位根因 在事件详情页面,故障传播链将展示调用链中的故障传播图谱。 图1 故障传播图谱
等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 注意事项 如需使用“应用资源管理”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。
存、时延的使用情况,通过火焰图的实时展示每一个方法的调用关系和执行率,帮助优化代码性能。 详细介绍请参见Profiler性能分析。 接口调用 接口调用主要是对外部服务调用当前应用程序进行监控。主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监
组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。 单击“日志”,切换至日志页签,详细操作参见搜索日志。 图1 查看日志 父主题: 组件列表
组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。 单击“Profiler性能分析”,切换至Profiler性能分析页签。 图1 Profiler性能分析 您还可以根据需要执行以下操作:
组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。 单击“Debugging诊断(Beta)”,切换至Debugging诊断页签。 图1 Debugging诊断 单击“对象分析”,进入对象分析页面。