检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
自定义插件接入AOM 您可以创建一个插件,在插件中通过脚本自定义需要上报到AOM的指标数据,并通过该自定义插件创建采集任务,即可采集自定义的指标数据到AOM,以监控该指标数据。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 创建自定义插件
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 您可以使用本文档提供的API对应用运维管理服务进行相关操作,例如创建、删除、查询等。支持的全部操作请参见API概览。 在调用应用
可设置为31天。 设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的告警。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。
非华为云主机安装ICAgent后为何无数据上报? 当您在非华为云主机上安装了ICAgent后,ICAgent上报数据需要访问如下端口,如果本地有防火墙配置,请打开如下端口的出方向否则对应数据无法上报,对应功能不可用。 8149: 上报指标数据使用 8102: 上报日志数据使用 8923: 上报APM(调用链、JVM)指标使用
指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可将关注的指标添加到仪表盘,对其创建阈值规则和导出监控报告等操作,以便实时查看业务及分析数据。 云服务监控 云服务监控展示华为云各服务实例的历史性能数据曲线。最长可查看近6个月内的数据,有助于用户了解实例运行状况。 日志
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。日志数据的相关费用统一
参数说明 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。 每周:在周几的某个固定时间点检查一次查询和分析结果。 固定间隔:按照固定间隔检查查询和分析结果。检查频率可以选择设置为固定间隔15秒或30秒以实现秒级监控。
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
单击“调用链”,切换至调用链页签,页面展示该组件调用链详情。 图1 调用链 通过选择实例、URL等查询条件查询,也可在界面下方新增自定义查询条件来查看调用链详情。详情请参考查看调用链。 父主题: 监控组件性能指标
在“告警信息”页签下单击告警规则、日志组、日志流等蓝色字体可下钻到具体详情页面,查看更详细的数据。 在华东-上海一区域查看告警时支持以下功能: 告警源为LTS的告警:单击告警详情页中日志组、日志流、关键词、查询语句可跳转到具体详情页面,查看更详细的数据。 关联CCE类型Prometheus实例的告警规则触
单击“免费开通服务并授权”,即可免费开通AOM 2.0服务。 在页面上方的左侧导航栏单击任意一个功能名称,如“仪表盘”,可进入该功能的操作界面。 父主题: 迁移AOM 1.0数据至AOM 2.0
b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证Memcached Exporter是否部署成功,有指标数据返回则表示Memcached Exporter已部署成功。有以下三种方法进行验证:
传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制 如需使用“应用
b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证ElasticSearch Exporter是否部署成功,有指标数据返回则表示ElasticSearch Exporter已部署成功。有以下三种方法进行验证:
为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析。 告警 告警是指AOM自身或ServiceStage、CCE、APM等外部服务在异常情况或在可能导致异常情况下上
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入采集管理器Uniagent
指标别名 用户自定义输入,不允许为空。 查询指标 查询方式 目前仅支持SQL查询。 查询语句 在输入框输入SQL查询语句,输入完成后,单击可一键调整SQL语句格式。单击可查看SQL语句的相关语法说明。 查询时段 在下拉列表中选择查询时段,包含“近1分钟”、“近10分钟”、“近