检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Verify的开关必须开启。 图4 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图5 配置完成 父主题: Prometheus监控
HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length HTTP协议标准报头。用于指明实体正文的长度,以字节方式存储的十进制数字来表示。 xxx Content-Type HTTP协议标准报头。用于指明发送给接收者的实体正文的媒体类型。 application/json
持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
does not exist. agentId不存在。 请联系技术支持工程师解决。 500 AOM.32000016 Database operation failed. 数据库操作异常。 请联系技术支持工程师解决。 500 AOM.32000023 The Agent is abnormal
列表框,可另存、重命名或删除仪表盘。 重命名 删除 导出监控报告 单击“导出监控报告”,可将仪表盘中的曲线图以CSV格式导出,以便进行本地存储及进一步分析。 设置全屏模式在线时长 选择待操作的仪表盘,在“仪表盘”页面右上角单击。 在弹出的对话框中设置全屏模式在线时长。 图8 设置在线时长
子应用可以理解为服务,对组件/微服务的归组分类。 组件 构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。
创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。
管理的基本单位,可以创建日志流以及设置日志存储时间,每个账号下可以创建100个日志组。创建日志组详细操作参见日志组。 日志流 选择日志流。日志流(LogStream)是日志读写的基本单位,日志组中可以创建日志流,将不同类型的日志分类存储,方便对日志进一步分类管理。创建日志流详细操作参见日志流。
日志配置”,在“配置中心 > 采集开关”页签,将“日志采集开关”置于“开启”状态。 日志的计费依据为日志使用量,包括日志读写、日志索引和日志存储。超过免费额度后,将无法再进行日志读写和索引,同时也不再产生日志读写和索引费用。此时需要打开“超额继续采集日志”开关。方法如下: 登录AOM控制台,在左侧导航栏中选择“配置管理
ECS类型Prometheus实例的指标数据不支持展示资源类型。 指标量(最近10分钟) 最近十分钟新存储的指标量。 云服务类型Prometheus实例的指标数据不支持展示最近十分钟新存储的指标量。 占比 该指标数量在所有指标中的占比。 云服务类型Prometheus实例的指标数据不支持展示指标占比。
在左侧导航栏选择“日志设置”,单击“分词配置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 单击“分词配置”页签。 分词配置 ICAgent采集 为了减少内存、数据库和磁盘空间占用,您可以按需进行ICAgent采集设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。 在左侧导
应用类型用于标记应用的分类,仅用于规则分类和界面展示,可以填写任意字段。如按技术栈分类可写Java,Python。按作用分类可填写collector(采集),database(数据库)等。 若您未设置组件名,则组件名默认为unknownapplicationname。 当添加了多条命名项时,所有命名项将拼接在
匹配关系。 图5 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图6 配置完成 父主题: 接入管理
务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 创建资源分组 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案
应用类型用于标记应用的分类,仅用于规则分类和界面展示,可以填写任意字段。如按技术栈分类可写Java,Python。按作用分类可填写collector(采集),database(数据库)等。 若您未设置组件名,则组件名默认为unknownapplicationname。 当添加了多条命名项时,所有命名项将拼接在
获取应用接口发生调用时产生的调用链数据,然后根据应用近7天的调用链数据来训练调用链模型。默认每14天后台自动更新模型,并将模型保存在后台数据库中。 在线推理阶段:当用户单击事件卡片,进入到根因分析页面时,会触发根因分析模型的在线推理任务,在线推理任务会基于上一步离线训练完的调用链
告警规则模板版本。 表6 AlarmRuleTemplateSpecWithCloudService 参数 参数类型 描述 related_cloud_service String 关联的云服务。 related_cce_clusters Array of strings 关联的CCE集群。
子应用可以理解为服务,对组件/微服务的归组分类。 组件:构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过