检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
了常用中间件exporter接入操作指导,由于AOM兼容原生Prometheus,所以您也可以安装社区其他的Exporter。 操作方式 如果您所使用的基础组件还没有提供相应的集成方式,可以参考如下方式进行集成,以及自定义监控大屏来满足相应的监控需求。 开源社区Exporter列表。
日志组(LogGroup)是云日志服务进行日志管理的基本单位,可以创建日志流以及设置日志存储时间,每个账号下可以创建100个日志组。创建日志组详细操作参见日志组。 日志流 日志流(LogStream)是日志读写的基本单位,日志组中可以创建日志流,将不同类型的日志分类存储,方便对日志进一步分类管理。详细操作参见日志流。
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格
成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 抑制规则的描述。最多不能超过1024个字符。 抑制规则 根源告警 根源告警表示产生抑制的某类特定告警。 根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并
单击列表右上的导出列表项,可以导出当前页的列表信息,最大支持导出100条。 单击“总次数”列的蓝色数值,可以查看所选时间段内该线程异常总数的趋势图。 单击“消息”列的蓝色文字,可以查看消息的详细内容,包括:时间和消息内容。 单击“异常堆栈”列的“查看详情”可以查看异常的详细信息。 单
实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当Linux系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 登录AOM控制台,在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“集群:xxx”或“其他:用户自定义接入主机”。
用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。 在配置完应用发现之后,可以使用AOM监控应用的各项指标,关联应用对应的资源告警等,主要特性与场景如下: 提供应
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态。单
港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。
传入升序或降序,升序:ASC,降序:DESC。 最小长度:1 最大长度:16 enterprise_project_id 否 String 企业项目id,根据企业项目id搜索。 最小长度:1 最大长度:64 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 elements
传入升序或降序,升序:ASC,降序:DESC。 最小长度:1 最大长度:16 enterprise_project_id 否 String 企业项目id,根据企业项目id搜索。 最小长度:1 最大长度:64 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 elements
您可快速查看组件实例或主机的日志文件,以便定位问题。 查看日志文件 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志文件”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志文件”页面。 在“日志文件”页面选择“组件”或“主机”页签并单击名称,在页面右侧的日志文件列表中即可查看其实例的日志文件名称、最新写入时间等。
快速查询日志 当您需要重复使用某一关键字搜索日志时,可以将其设置为快速查询语句。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“原始日志”页面单击,设置快速查询参数,具体的参数说明如表1所示。 图1 创建快速查询 表1 快速查询参数说明 参数名称 说明
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
式按天进行结算。具体扣费规则可以参考按需产品周期结算说明。 例如:按天结算的云服务器在2023/06/18 8:30删除资源,但是2023/06/18 8:00~9:00期间产生的费用,通常会在2023/06/19 0:00:00才进行扣费。 您可以在“费用与成本 > 费用账单 >
最多不能超过100个字符。 描述 分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。
场景选择超限阈值;只要阈值状态发生变化时,您都需要收到通知,则触发场景可以全选。 图2 定义阈值 单击“添加”,完成创建多个单条静态阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。 对于一个单条静态阈值规则,若其监控对象为某个主机,当主机的CPU使用率超限时,