检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
消息处理方法调用次数 平均响应时间(ms) 平均响应时间(ms) 错误次数 消息处理错误次数 最慢调用(ms) 最大响应时间 创建连接数 创建连接数 关闭连接数 关闭连接数 关闭原因 连接关闭的原因 流量(M) 流量 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数
示例流程 图1 给用户授权自动化运维权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予自动化运维只读权限“CMS ReadOnlyAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 新创建的用户登录控制台,验证自动化运维的只读权限。
AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“主机组管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明
概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 使用限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。
最大线程数 该端口的最大线程数 最大连接数 该端口的最大连接数 当前连接数 该端口在采集时间点的当前连接数 连接数峰值 该端口在采集周期内最大连接数 版本 版本 tomcat版本 在下拉列表中选择想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
配置虚机日志的采集路径时,不建议和容器服务日志映射到虚拟机上的日志目录相同,若相同则采集到的日志内容会互相覆盖掉,采集的日志可能会变成容器日志。 界面方式-单虚机 登录AOM控制台,在左侧导航栏中选择“日志 > 日志路径”,选择“主机日志”页签。 在虚机列表中单击虚机所在行“操作”列的“配置”,为单个虚机配置一条或多条日志采集路径。
长,则退出到登录界面。 全屏模式在线时长优先级高于系统在线超时退出机制。 例如,登录控制台后,打开了AOM全屏界面并设置在线时长为2小时,同时打开了AOM全屏界面外的其他任意界面,则对于其他任意界面该设置也同时生效,即2小时后自动退出到登录界面。 当所有全屏界面都退出后,则恢复系统在线超时退出机制。
Remote Read地址的参数说明如下: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 project_id :项目的ID。 获取Remote
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
例如,登录控制台后,打开了AOM全屏界面并设置在线时长为2小时,同时打开了AOM全屏界面外的其他任意界面,则对于其他任意界面该设置也同时生效,即2小时后自动退出到登录界面。 当所有全屏界面都退出后,则恢复系统在线超时退出机制。 例如,登录控制台后,打开了多个AOM全屏界面并设置在
region_name为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同,您可以从地区和终端节点中获取。例如AOM服务在“华北-北京一”区域名称为“cn-north-1”。 Site domain name suffix 为站点域名后缀,例如“myhuaweicloud.com”。
选择对应日志组、日志流下的可视化图表,单击“确定”。若该日志流下没有图表或没有所需的图表,单击界面上的“前往添加图表”,进入可视化界面,设置完成后单击“保存并返回”返回到告警规则界面,自动打开创建规则弹框,填充新创建的图表及图表的查询语句。 可以指定图表的查询时间(1 ~ 60分钟/1
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。
指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标 指标名称 指标含义 取值范围 单位 主机指标 CPU a
事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您可根据需要对事件进行处理。用户可通过“事件”页面查看需要关注的事件,监控系统运行情况。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。 单击“事件”页签,查看事件信息。
“删除”。 添加接入指标 在左侧日志指标规则列表中,单击规则名称。 在右侧页面单击“添加接入指标”。具体操作请参见添加接入指标。 编辑接入指标 在左侧日志指标规则列表中,单击规则名称。 在右侧页面选择一个接入指标卡片,单击。具体操作请参见添加接入指标。 删除接入指标 在左侧日志指标规则列表中,单击规则名称。
数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient、GaussDb、Hikari连接池、Jetcd、ObsClient、MySQL、Postgresql、Or
内核占用率。 检测规则设置为“最大值>0.2”。 触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。 单击“指标
在左侧导航栏选择“Prometheus监控 > 实例列表”,然后单击“创建Prometheus实例”。 设置实例名称、企业项目和实例类型信息。 表1 创建Prometheus实例 参数名称 说明 实例名称 Prometheus实例的名称。 只能由中文、字母、数字、下划线、中划线组