检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes
IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN 指标 云服务接入AOM 开源监控系统接入 Prometheus通用实例 指标 开源监控系统接入AOM Prometheus API/SDK接入 应用运维管理AOM API 指标 通过API接入相关的指标数据。
成后即可关闭。 在K8S集群中安装ICAgent,当K8S集群版本升级后是否会对原本安装的ICAgent有影响? 答:升级k8s集群版本后系统会重启ICAgent,并将ICAgent的版本升级到最新。 父主题: 采集管理
关系型数据库,稳定高效,支持大量数据,广泛应用于网站和应用开发。具体操作请参见: MySQL日志接入(LTS) MySQL指标接入(AOM) Redis 内存数据结构存储系统,支持多种类型,用作数据库、缓存和消息代理。具体操作请参见: Redis日志接入(LTS) Redis 指标接入(AOM) Kafka 分
135 解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。 5.12.130 支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。
全屏模式在线时长优先级高于系统在线超时退出机制。 例如,登录控制台后,打开了AOM全屏界面并设置在线时长为2小时,同时打开了AOM全屏界面外的其他任意界面,则对于其他任意界面该设置也同时生效,即2小时后自动退出到登录界面。 当所有全屏界面都退出后,则恢复系统在线超时退出机制。 例如
分钟内组件CPU&内存使用率的值。 趋势图上方的值为所选组件下监控的最新时间点CPU&内存使用率的值。 在卡片左下角通过勾选“隐藏系统组件”可隐藏系统组件。 集群监控(磁盘)卡片 图5 集群监控(磁盘) 此卡片主要展示了3种信息: 统计最新时间前1分钟内的集群的磁盘使用率在TOP5的集群信息。
据需要对事件进行处理。 功能说明 告警行动规则:通过创建告警行动规则关联SMN主题与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 告警降噪:在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 需要设置是否启用告警行动规则。启用后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。
在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 其他相关操作 AccessCode创建完成后,您还可以对AccessCode列表执行表1中的操作。
进行监控。 相关配置请参见查看组件基础监控项。 异常 异常监控项是对应用的异常日志进行监控。例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 相关配置请参见查看组件异常日志。 外部调用 外部调用是对当前应
在作业、标准化运维中定义的全局共享参数,支持字符串,主机列表类型。除了达到多步骤参数共享目的,可清晰的看到整个流程涉及的全部参数和用途。 OS账号 用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。
式命令行。 通过CCE模板填充:不确定指标信息或对普罗格式不了解时,可采用系统自动填充方式。在下拉列表中选择“CCEFromProm”,单击“请选择默认模板”,从默认提供的CCE模板中选择合适的模板,系统会根据选择的模板自动填充相关指标的普罗格式命令行。 单击告警规则详情后的,可
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号
机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统,且主机已安装ICAgent,即可将主机接入到AOM中进行监控。 日志 AOM提供了海量运行日志的检索和分析功能,支持日志采
Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主机的操作系统,当前只支持选择Linux。 采集插件 默认CONSUL。 插件版本 选择插件的版本。未上线的插件版本,则置灰,无法选择。 采集任务
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警
此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段,可采用系统默认字段,也可根据需要自定义字段。 { "starts_at" : 1579420868000, "ends_at" :
中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。同时,AOM开放统一API,支撑对接自研监控系统或者报表系统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优