检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
采集任务参数配置表 操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 时间序列 由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 远程存储 自研的时序数据存储组件。支持Prometheus监控的Remote Write协议,由云产品全面托管。 云产品监控 无缝集成了多种云产品的监控数据。用户
ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装。 AOM和LTS使用的ICAgent功能完全相同,ICAgent采集的指标数据均上报到AOM分析处理,日志数据则只能匹配系统中最新的日志采集配置。
十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助
变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。
机监控(磁盘)、主机监控(网络)、集群监控(CPU&内存)和集群监控(磁盘)等多种数据信息卡片,下面分别介绍各卡片内容及操作: 基础设施监控卡片 图1 基础设施监控 此卡片主要展示基础设施的指标数据。可通过选择集群,呈现某一个集群或者所有集群中的信息。如图选择所有集群,即该基础设施监控卡片呈现所有集群的如下信息:
确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳板机转发命令不包含域名信息,即不支持通过域名方式安装ICAgent。 操作步骤 非华为云上的服务器安装ICAgent,请先在华为云上购买一台弹性云服务器作为跳板机,然后执行如下操作:
日志搜索与分析(默认推荐) 日志搜索与分析(管道符方式-邀测) 日志应用 日志转储 主机和云服务的日志数据上报至AOM或LTS后,用户可根据需要设置存储时间。超出存储时间的日志数据将会被自动删除,对于需要长期存储的日志数据(日志持久化),通过日志转储功能,可以将日志转储至其他云服务中进行长期保存。 登录AOM
查看应用性能指标 应用概览页面展示应用维度的指标数据,包含url调用次数、url平均响应时间、url错误率等;同时支持“购买特惠包”以及“接入应用”。 查看应用性能指标 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请参见表1。 图1
服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形成动态上界,以比对近10分钟的数据是否有异常。支持如下事件类型:
百分比(%) NPU存储容量(aom_node_npu_memory_free_megabytes) 该指标用于统计测量对象的NPU存储容量。 >0 兆字节(MB) NPU存储使用率(aom_node_npu_memory_usage) 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。
采集任务参数配置表 操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制 如需使用“应用
AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
动开启基于调用链的根因分析模型的离线训练任务,并自动获取应用接口发生调用时产生的调用链数据,然后根据应用近7天的调用链数据来训练调用链模型。默认每14天后台自动更新模型,并将模型保存在后台数据库中。 在线推理阶段:当用户单击事件卡片,进入到根因分析页面时,会触发根因分析模型的在线
或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。当资源的日志数据满足设置的告警条件,产生日志告警。 告警规则分为指标告警规则、事件告警规则
开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 查询分析设置 X轴数据 支持数字或字符串数据。 Y轴数据 支持数字或字符串数据,可以选择多个数据。 维度列 请从下拉列表中选择,一般为有序数据类别。 趋势对比 当X轴为时间数据时,且不设置维度列时,可开启该按钮。 开启后,设置比较对象时间
安装采集管理器Uniagent。 镜像概述 镜像是一个包含了软件及必要配置的云服务器或裸金属服务器模板,包含操作系统或业务数据,还可以包含应用软件(例如,数据库软件)和私有软件。镜像分为公共镜像、私有镜像、共享镜像和市场镜像。 镜像服务(Image Management Serv
您第一次配置一次性转储后失败,请15分钟后重试。 不支持转储到存储类型为归档存储或配置了跨区域复制的OBS桶。 obs-store-test 所属桶目录 OBS桶中存储日志的目录。 说明: 如果不配置,则日志默认存储在OBS桶的根目录下。 /home/One-off Dump 添