检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
失。 桶日志 桶日志是AOM提供的一种细粒度日志查询功能,您可以日志桶为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析。 告警 告警是指AOM自身或Service
30378 port: 9121 targetPort: 9121 验证Redis Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。
异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
设置搜索条件搜索要查看的组件。 不支持通过别名搜索组件。 单击组件名称,进入“组件详情”页面。 在“组件详情”页面右上角可设置查询时间范围,查询该组件的pod实例、主机或告警信息。如果该时间范围内不存在相关数据,AOM会自动跳转到“组件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。
输入“i”进入编辑模式,添加如下配置信息: server { listen 8080; # 根据业务情况进行调整。侦听端口 listen [::]:8080; # 根据业务情况进行调整,ipv6侦听端口 server_name localhost; # 根据业务情况进行调整 location =
首页介绍 资源检索 资源检索提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 图1 资源检索 搜索条件只允许输入2~124字符。 允许输入多个ID、关键字或名称搜索,多个搜索条件之间请用“,”间隔。例如搜索名称包含“AOM”和“LTS”的应用或资源,可在搜索框输入“aom
组件(进程) CPU内核总量、CPU内核占用、CPU使用率等 主机网络 接收Bps、接收错包率、发送错包率、总Bps。 主机磁盘、文件系统 磁盘读取速率、磁盘写入速率、磁盘使用率。 主机指标 CPU内核总量、物理内存使用率、主机状态、NTP偏移量。 应用性能指标 请求平均时延、错误调用次数、请求吞吐量。
单击工作负载名称,可查看该工作负载的详细信息。 在“Pod实例”页签下,可查看该工作负载所有实例的概况。单击实例名称,可查看该实例下所有容器的资源使用与健康状态。 在“监控视图”页签下,可视化展示该工作负载的资源使用情况。 在“告警”页签下,可查看该工作负载的告警详情,详情请参见查看AOM告警或事件。
选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。 命令行输入:提供手动输入和系统自动填充两种输入方式。
选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。 命令行输入:提供手动输入和系统自动填充两种输入方式。
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
设置搜索条件搜索要查看的组件。 单击组件名称,进入“组件详情”页面。 在“实例列表”页签,可查看该组件所有实例的概况。单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签,可查看该组件所在的主机概况。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资
通过Debugging诊断对象 对象分析用于分析某个对象内部状态,并支持查看对象参数值和详细信息。 通过Debugging诊断对象 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
Write地址实现自建Prometheus数据上报到AOM 查看Prometheus实例指标上报量 基础设施监控 支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及
应用监控”,查看应用列表。 可以在应用列表上方设置过滤条件,实现应用列表过滤显示。 单击应用名称,在“应用详情”页面,以应用维度对组件进行批量管理与监控。 您还可查看当前应用包含的组件列表、主机列表和告警分析。 在“应用详情”页面右上角可设置查询时间范围,查询该应用的组件、主机或告警信
对某个资源进行监控。 如下图所示,对于一个单条阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。 图3 单条阈值规则 更多阈值规则操作
nctionGraph。 查看资源信息 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 在左侧导航栏中选择“资源管理”,在右侧区域单击任一资源页签,即可在下方资源列表区域查看该资源所有实例的名称、项目、环境等信息。
日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK? 日志费用说明 在控制台查看不到日志怎么办? 如何处理界
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则