检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
值等,配置参数的说明具体请参见指标数据类图表。 说明: 如果您是使用的是新版仪表盘,图表的配置参数说明请参见指标数据类图表。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 统计周期 指标数据按照所设置的统计周期进行聚合。 统计周期
应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考配置应用发现规则。
操作系统。 登录账号:登录主机的账号。当操作系统为LINUX时,建议使用root账号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。 密码:登录主机的密码。 连接测试结果:连接测试的结果,测试安装机和需安装主机间的网络连通性。 操作:删除、复制和连接测试。
用对事件进行处理。 阈值规则 阈值规则:对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生阈值告警(阈值告警即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据不足事件即由阈值规则触发而产生的事件)。同时执行自定义的触发策略,当阈值规则的状态(正
环境”的应用管理模型。 资源管理 对用户所有的各类云服务进行统一管理。可全局查看所有的云服务资源对象与应用的关联关系,包括未绑定应用的云资源,便于用户对资源进行分析和管理。 环境标签 根据实际的使用场景,为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 企业项目 华为云企业项目,一个项目可以包含一个或者多个应用。
事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形成动态上界,以比对近10分钟的数据是否有异常。支持如下事件类型:
统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。
在左侧导航栏中选择“采集设置 > CCE接入”。 查看已接入的CCE集群。可根据集群名称,在搜索框中搜索集群。 执行ICAgent操作 您可以对已接入的CCE集群中的主机进行ICAgent插件的安装、升级和卸载。 安装ICAgent:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。
探针管理 Agent通过字节码增强技术进行调用埋点,运行在应用所在的服务器上,实时采集应用性能相关的数据。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 探针管理”,进入探针管理页面。 您可以根据需要执行以下操作: 搜索主机,支持按照“应用”、“组件”、“环境”、“IP”或“主机名”筛选。
层运维场景服务提供准确、及时、一致的资源配置数据。 采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放 支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。
日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对于
展示“全部实例”的“GRPCServer监控”信息。 图1 查看远程过程调用 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
单击“基础监控”,切换至基础监控页签。页面默认展示“全部实例”的“JVM监控”信息。 您还可以根据需要执行以下操作: 在“实例名称”和“监控项”下拉框中选择实例与监控项,可以查看该实例在对应采集器下的不同指标集下的应用监控数据,具体指标及说明请参见基础监控。 在图表中选中某一个时间节
根据指定字段对分组后的告警合并 。合并在一组的告警会被汇聚在一起发送一条通知。 合并方式包括: 按告警源:由相同告警源触发的告警,合并为一组发送告警通知。 按告警源 + 严重度:由相同告警源触发的告警,且其严重度相同时,合并为一组发送告警通知。 按告警源 + 所有标签:由相同告警源触发的告警,
N主题与消息模板,当CCE的指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 配置告警:通过创建告警规则对CCE的指标设置告警阈值条件,当指标数据满足设置的告警阈值条件时产生告警。 准备工作 本文以监控云容器引擎 CCE的指标为例,需要提前在CCE中
Exporter是Prometheus的开源指标数据收集插件,负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。通过接入弹性云服务器ECS,您可以为主机组安装Node Exporter并配置采集任务,采集到的指标会存储在ECS类型Prometheus实例中,方便您管理。
您可通过接入管理生成的认证凭据access_code,将原生Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过gra
事件名称:根据“监控对象”设置的事件名称显示。如果在“监控对象”中未选择具体的事件名称,则此处显示为全部事件且不可选。 触发方式:事件类告警的触发方式。 累计触发:某个监控周期内达到累计次数则触发告警,按照设置的频率发送对应的事件告警通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期
Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主机的操作系统,当前只支持选择Linux。 采集插件 默认CUSTOM_EXPORTER。 插件版本 选择插件的版本。 说明:
连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计方式:指标数据按照所设置的统计方式进行聚合。 统计周期:指标数据按照所设置的统计周期进行聚合。 选择是否发送通知:当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,选择是否发送邮件或短信通知该变动。 如需使用邮件或短