检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
这些特征的类别。图1以集群指标为例,介绍了命名空间、维度和指标的关系。 图1 集群指标 AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例
应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用
B/S、KB/S、MB/S、MB/S、TB/S 自定义 - (可选)实时预览日志。单击“实时日志预览”,在实时日志预览弹框中,您可以查看实时上报的日志,实现对日志数据的快速检索与分析,具体请参见查看LTS实时日志。 单击“确定”。创建成功后,可以在“业务指标(新版)”页面查看新增的指标。 相关操作 还可以根据需要执行以下相关操作:
CCE的控制台,在左侧导航栏中选择“权限管理”,单击页面右上角的“添加权限”,单独进行权限设置。 单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。 单击工作负载名称,可查看该工作负载的详细信息。 在“Pod实例”页签
在左侧导航栏中选择“应用管理”,单击右上角的“创建应用”。 在弹出的“创建应用”页面中,设置创建应用的相关参数。 表1 创建应用参数说明 参数名称 说明 唯一标识 应用的唯一标识。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线和点组成。 应用名称 应用的名称。 支持输入2~64个
对于重点资源的指标您可以创建阈值规则,当指标数据满足阈值条件时,AOM会产生阈值告警。 日志管理 AOM提供强大的日志管理能力。日志检索功能可帮您快速在海量日志中查询到所需的日志;日志转储帮您实现长期存储;通过创建日志统计规则实现关键词周期性统计,并生成指标数据,实时了解系统性能及业务
在下拉列表中选择已创建日志组。如果没有可用的日志组,可单击“ELB日志接入LTS”创建新的ELB接入日志组。 所属日志流 在下拉列表选择已创建日志流。单击“日志预览”可查看该日志流包含的日志数据。 日志结构化 单击“结构化”,将选择的日志数据结构化处理。结构化配置的字段默认显示在下方列表中。 设置完成后,单击“下一步”。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
负载监控可及时了解工作负载的资源使用、状态和告警等信息。 集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控展示集群的Pods运行状态、CPU使用率等信息。 主机监控 通过主机监控功能您可以及时了解主机的资源使用情况、趋势和告警信息,使用这些信息,您可以快速响应和处理异常,保证主机流畅运行。
日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对于华北-
选择对应日志组、日志流下的可视化图表,单击“确定”。若该日志流下没有图表或没有所需的图表,单击界面上的“前往添加图表”,进入可视化界面,设置完成后单击“保存并返回”返回到告警规则界面,自动打开创建规则弹框,填充新创建的图表及图表的查询语句。 可以指定图表的查询时间(1 ~ 60分钟/1
单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 启停Agent,单击主机列表Agent启停列下的按钮,即可停止Agent。 批量操作Agent:选中多个主机前的复选框,单击“批量操作Agent”,即可批量开启、停止、删除Agent。
平台,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。当CCE对接AOM后,支持将云容器引擎 CCE的集群信息上报至AOM,AOM可以实时监控CCE集群的状态和性能等,并提供告警通知。 您可通过在AOM中设置告警规则,及时了解CC
添加成功后,指定资源当前新产生的日志将会实时转储到OBS桶中。 例如,als0320a当前新产生的日志会实时转储到OBS桶obs-store-test的/home/Periodical Dump目录下,且每3个小时的日志转储到其对应的日志文件中。 周期性转储属于近实时转储,存在分钟级转储时
线程分析 线程分析支持显示该应用的所有线程和查看线程的堆栈信息,帮助您快速定位耗时较高的线程。 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 线程分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。
登录管理控制台的账号。 ${domain_name} 通知类型 创建通知规则时选择的类型:告警或事件 ${event_type} 事件级别 创建通知规则时选择告警或事件级别:紧急、重要、次要、提示 ${event_severity} 事件名称 触发通知规则的告警或事件的名称 $event
天。 查看每一个线程、方法、类和包的调用关系和执行效率的实时数据。 表2 Profiler参数说明 参数 说明 火焰图 火焰图Y轴(纵轴)表示调用栈,每一层都是一个函数(包),调用的越深,火焰层数越高,最底部(火焰尖)是正在执行的函数,上方是他的父函数。 火焰图X轴(横轴)表示占
为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出,无法实时进行监控。为满足您的多样化