检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。 当前运维可观测大屏预置了基础版的业务指标监控大屏模板。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。
通过设置模板中全局变量projectId、region、domainName和agencyName,将AOM系统监控数据呈现在大屏页面中。 获取全局变量的值。 将鼠标放在模板上,单击“播放”。 在跳转的页面中,获取projectId、region、domainName和agencyName的值。 例如,跳转页面的
TopN:统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU使用率,那么AO
TopN:统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU使用率,那么AO
分页查询时需要增加三个参数:lineNum(上一次查询出的内容中最后一条日志的序列号)、type(取值"next")和size。 2.category、searchKey、keyWord、startTime、endTime等条件需要保持和第一次查询时相同。 3.如果需要继续分页查询,则修改请求参数中的lineNum为
获取Python应用的指标、链路追踪和日志信息。具体操作请参见:Python组件调用链接入(APM)。 Node.js组件 获取Node.js应用的指标、链路追踪和日志信息。具体操作请参见:Node.js组件调用链接入(APM)。 PHP组件 获取PHP应用的指标、链路追踪和日志信息。具体操作请参见:PHP组件调用链接入(APM)。
获取IOS应用的指标、链路追踪和日志信息。具体操作请参见:IOS应用日志接入(LTS)。 微信小程序 获取微信小程序的指标、链路追踪和日志信息。具体操作请参见: 微信小程序日志接入(LTS) 微信小程序调用链接入(APM) 支付宝小程序 获取支付宝小程序的指标、链路追踪和日志信息。具体操作请参见:
条件时产生告警。 准备工作 本章节以监控云容器引擎 CCE的指标为例,需要提前在CCE中购买集群和节点,详细请参考购买Standard/Turbo集群和创建节点。如果您已有可用的集群和节点,可重复使用,不需要再次购买。 首次开通AOM 2.0并授权 注册账号并实名认证。 使用AOM
华为云根据客户等级定义了不同客户的宽限期和保留期时长。 避免和处理欠费 欠费后需要及时充值,详细操作请参见账户充值。 您可以在“费用中心 > 总览”页面设置“可用额度预警”功能,当可用额度、通用代金券和现金券的总额度低于预警阈值时,系统自动发送短信和邮件提醒。 当产生欠费后,请您及时充值使可用额度大于0。
检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。 每周:在周几的某个固定时间点检查一次查询和分析结果。 固定间隔:按照固定间隔检查查询和分析结果。检查频率可以选择设置为固定间隔15秒或30秒以实现秒级监控。
支持基于Prometheus、LTS日志和自定义渠道的业务监控。 应用监控 不支持 支持对JVM、Spring、Nginx、Tengine和Tomcat等的监控。 线下IDC监控 不支持 支持基于Prometheus Exporter的线下硬件、存储和网络等监控。 线下中间件监控 不支持
插件版本 自定义插件的版本号。 插件脚本 自定义插件脚本。通过插件脚本自定义需要上报到AOM的指标数据,脚本类型为Linux和Windows。 Linux:Shell脚本和Python脚本。 示例: #!/bin/bash #Examples echo "metric_name{labe
要统计的话,建议将日志都接入到LTS,通过LTS的日志资源统计功能来统计。 具体的操作方法如下: 为应用创建对应的日志组和日志流。创建方法请参见:创建日志组和日志流。 登录LTS控制台,通过“资源统计”功能查看Top100的日志组或日志流详细的资源统计数据。 父主题: 日志分析
环境的类型。目前支持环境类型有四种:开发、测试、预发布和生产。 主机类型 主机的类型。目前支持的主机类型有:LINUX和WINDOWS。 环境名称 环境的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 区域 环境的区域,请从下拉列表中选择。
采集管理 ICAgent和UniAgent是同一个插件吗? 如何处理界面“ICAgent状态”为“离线”的问题? 在主机上手工安装ICAgent后提示安装成功,但UniAgent安装与配置界面显示状态异常? ICAgent安装成功后,无法在界面上获取到ICAgent状态 ICAg
常见问题 了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗? ECS主机上执行UniAgent安装命令,下载安装脚本失败
控主机和Kubernetes集群的众多性能指标。 通过CCE的kube-prometheus-stack插件、自建K8s集群、ServiceMonitor、PodMonitor等多种方式采集上报指标,监控部署在CCE集群内的业务数据。 通过丰富的告警模板,帮助业务快速发现和定位问题。
登录云容器引擎控制台(旧版)。 左侧导航栏选择“资源管理 > 网络管理”,在Service页面获取Grafana服务的访问地址和端口,以及Prometheus服务的访问域名和端口。 左侧导航栏选择“配置中心 > 配置项”,在配置项页面找到grafana-conf配置项,单击“编辑YAML”
设置完成后,监控的指标数据以折线图形式显示在告警条件上方。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 表3 告警规则详情填写说明 参数名称 参数说明 示例 多指标 按设置的多个指标数据和对应告警条件逐条计算,只要满足一个条件则触发告警。 多指标 指标 需要监控的指标。单击“
“查看调用链”或者“查看指标”,支持查看调用链或组件性能指标,详情请参见查看调用链和查看组件性能指标。 可通过鼠标左键选中调用对象的图标,移动位置,来改变拓扑图布局。 单击“重新布局”按钮,将修改后的拓扑图恢复至默认的布局。 单击刷新时间选择按钮,选择刷新拓扑图数据的方式和自动刷新的时间。当前支持“手动刷新”、“1分钟