检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
”开头,且以0~9、a~z、A~Z或下划线(_)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息的详细说明请参见指标维度。 自定义指标维度:
etheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM支持以下原生Prometheus的API:
模糊查询匹配字段,可以为空。如果值不为空,可以模糊匹配metadata字段中的必选字段的值。 sort 否 sort object 返回列表的排序方式,可以为空。 metadata_relation 否 Array of RelationModel objects 查询条件组合,可以为空。 表5
”开头,且以0~9、a~z、A~Z或下划线(_)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息请分别参见后续章节。 自定义指标维度:维度为1~32位的字符串,需要您自定义。
模糊查询匹配字段,可以为空。如果值不为空,可以模糊匹配。metadata字段为必选字段。 sort 否 sort object 返回列表的排序方式,可以为空。 metadata_relation 否 Array of RelationModel objects 查询条件组合,可以为空。 表5
conditions 是 参见表5 conditions最多5个,最少1个 匹配条件内容。一个规则可以有多个条件,多个条件之间的关系是“并且”,内部描述了多个详细匹配条件。一个条件可以描述一个metric的匹配方式。 actions 是 参见表6 actions最多5个,最少1个 指定策略匹配成功后执行的动作。
供您选择使用。 周期性转储:将当前日志实时转储到OBS桶中,且以转储周期为粒度对1天的日志进行分割。 例如,您需长久存储固定维度的日志,就可以选择周期性转储,操作详见添加周期性转储。 一次性转储:将历史日志一次性转储到OBS桶的同一个.log日志文件中。 一次性转储类似于“日志搜
消息模板中通过$event.annotations.key2变量获取标注信息,具体请参见消息模板变量说明。 管理告警标签/告警标注 用户可以在告警规则界面对告警标签或告警标注进行增删改查。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 单击“创建”
实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read Prometheus配置代码。在代码右侧单击可复制该代码到对应文件。 Remote Read配置为:
配置都失效。 配置日志采集路径 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志路径”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。 在虚机列表中单击虚机所在行“操作”列的,为单个虚机配置一条或多条日志采集路径。 您既可使用IC
方法分析 方法分析支持检查正在运行的方法的耗时明细、调用来源以及方法源码。用于快速定位问题的根本原因,以及问题线下无法复现或日志缺失等场景。 方法分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
通过Grafana查看Prometheus实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 问题描述 通过helm部署pod的yaml文件后,AOM无法检测到工作负载。 原因分析 通过对比helm部署pod的yaml文件和在CCE控制台部署的pod yaml文件,发现helm部署pod的yaml文件中缺少env参数。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
为什么购买的资源在“资源管理”界面看不到? 如果确认资源购买成功,请先通过“资源>我的资源”查看是否有此资源。如果确认资源已经展示在“我的资源”处,即可在“资源管理”界面,单击“刷新”,即可显示相关资源。 图1 查看资源 图2 刷新“资源管理”界面 父主题: 应用资源管理(日落)
查看日志文件 您可快速查看组件实例的日志文件,以便定位问题。 查看日志文件 在左侧导航栏中选择“日志 > 日志文件”。 在“日志文件”页面选择“组件”或“主机”页签并单击名称,在页面右侧的日志文件列表中即可查看其实例的日志文件名称、最新写入时间。 单击该实例“操作”列的“查看”,
事件根因分析 事件根因分析服务提供异常事件快速根因定位分析的功能,根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位根因。 功能入口 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围:
flink_jobmanager_Status_JVM_Memory_Metaspace_Max JobManager MetaSpace内存池中可以使用的最大内存量。 字节(Byte) flink_jobmanager_Status_JVM_Memory_Direct_Count JobManager
已发现的进程设置组件名。例如,添加固定文字"app-test"拼接起来作为组件名。 应用类型用于标记应用的分类,仅用于规则分类和界面展示,可以填写任意字段。如按技术栈分类可写Java,Python。按作用分类可填写collector(采集),database(数据库)等。 若您未
线程分析 线程分析支持显示该应用的所有线程和查看线程的堆栈信息,帮助您快速定位耗时较高的线程。 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 线程分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。