检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过Grafana查看Prometheus实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。
通过AOM查看事件根因分析结果 智能洞察提供异常事件快速根因定位分析的功能。根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位事件根因。 查看事件根因分析结果 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看
调用链”,进入调用链页面。 图1 查看调用链 在“调用链”页面中查看调用链信息。 在查询条件下输入查询条件查询具体的调用链列表,也可在界面下方新增自定义查询条件。 表1 调用链查询条件说明 查询条件 说明 必填/选填 应用 选择调用链所在应用。 必填 区域 选择调用链所在区域。 必填 组件 选择调用链所在组件。
作负载、容器组信息。 按告警管理维度查看当前集群的运行状态。 在左侧导航栏选择“告警管理 > 告警列表”,可查看该集群的告警详情,详情请参见查看AOM告警或事件。 在左侧导航栏选择“告警管理 > 事件列表”,查看该集群的事件详情,详情请参见查看AOM告警或事件。 在左侧导航栏选择“告警管理
在“网卡”页签下,在列表中可查看该主机网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。 在“显卡”页签下,在列表中可查看该主机显卡的基本信息,单击显卡名称,可在“监控视图”页面监控该显卡的各种指标。 在“事件”页签下,可查看该主机的事件详情,详情请参见查看AOM告警或事件。
h为“/v3/auth/tokens”。 query-string:查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”,形式为“参数名=参数取值”,例如“limit=10”,表示查询不超过10条数据。 例如您需要创建IAM用户,由于IAM为全局服务,
怎样查看AOM中的日志是通过哪个应用产生的? 问题描述 AOM日志中每天产生大量日志,怎样查看AOM中的日志是通过哪个应用产生的? 解决方法 AOM没有资源统计的功能,无法查看日志所属的应用。用户需要统计的话,建议将日志都接入到LTS,通过LTS的日志资源统计功能来统计。 具体的操作方法如下:
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
在页面右上角设置指标信息的统计周期,查看不同时间段的历史数据。 设置时间范围,查看已设时间范围内上报的指标。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。
如何通过创建委托获取AK/SK? 通过创建委托,ICAgent自动获取用户的访问密钥(AK/SK)帮助用户进行应用性能管理。 创建委托 登录华为云控制台。 单击右上角的用户名称,如图1,选择“统一身份认证”。 图1 用户名称 在“统一身份认证”页面中,单击“委托”,进入委托页面。
用户自建k8s容器监控方案,当前只支持通过Prometheus的remote_write功能,将容器指标写入AOM指标库,通过指标浏览查询相关指标信息。 工作负载监控是逐层下钻设计,层次关系为:工作负载->Pod实例->容器->进程,在界面上可直观查看各层关联关系。每层监控的内容包括指标、日志、告警等信息。
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案
通过AOM监控进程 配置AOM应用发现规则 通过AOM监控应用进程 通过AOM监控组件进程 父主题: 基础设施监控
在配置项页面找到grafana-datasources配置项,单击“编辑YAML”,将"url"修改成Prometheus的访问域名。 修改以上两个配置文件之后,重启grafana pod,即可查看到监控数据。 父主题: 常见使用问题
时间倒序排序(即时间最新的日志显示在最前方)。 单击日志列表左侧的,可进一步查看该条日志的详细信息。 AOM支持查看上下文信息,您不用在原始日文文件中上下翻页查找日志,单击“操作”列的“上下文”,即可查看该日志的前若干条(即上文)或后若干条(即下文)的日志,方便您定位问题。 在“
或用户自定义命名空间 可通过查询标签值接口查询所有命名空间的值 metric_name 否 String 时间序列名称,名称长度取值范围为1~255个字符。取值范围:AOM提供的基础时间序列名称,cpuUsage、cpuCoreUsed等或用户上报的自定义时间序列名称。通过查询标签值接口查询所有时间序列名称
子页签,进入“性能分析”页面,执行如下操作: 在“性能分析”页面选择您想要查看的实例,设置性能分析类型、范围、以及聚合维度查询条件,即可以查看该实例对应的性能分析数据。 查询参数设置请参考下表: 表4 查询参数说明 选择项 参数 说明 类型 CPU Time 每个方法在CPU上的运行时间。
通过告警规则名称获取告警行动规则 功能介绍 通过告警规则名称获取告警行动规则。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/alert/action-rules/{rule_name} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
bearer_token: 'SE**iH' 检查内网域名配置。 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过Grafana查看AOM中的指标数据,来验证上述配置修改后数据上报是否成功。