检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Center,互联网数据中心)、第三方云厂商或华为云跨Region主机等。 约束与限制 安装UniAgent支持的Linux操作系统与Windows操作系统,详情请参见操作系统使用限制。 如果您进入的是旧版安装UniAgent页面,需在左侧导航栏选择“设置 > 采集设置 > UniAgent
container_fs_inodes_free 文件系统的可用inode数量 container_fs_usage_bytes 文件系统的使用量 container_fs_inodes_total 文件系统的总计inode数量 container_fs_io_current 磁盘/文件系统当前正在进行的 I/O
Center,互联网数据中心)、第三方云厂商或华为云跨Region主机等。 约束与限制 安装UniAgent支持的Linux操作系统与Windows操作系统,详情请参见操作系统使用限制。 如果您进入的是旧版安装UniAgent页面,需在左侧导航栏选择“设置 > 采集设置 > UniAgent
管理采集器底座UniAgent 业务层接入AOM 应用层接入AOM 中间件及自定义插件接入AOM 运行环境接入AOM 云服务接入AOM 开源监控系统接入AOM 管理日志接入
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
为什么购买的资源在“资源管理”界面看不到? “我的资源”已经释放删除了,为什么还会在界面展示? 为什么CMDB资源管理已经看到资源了,绑定环境的时候找不到资源? 搜索应用时,系统提示“AOM.11007006: get policy list failed.”
两者有如下的区别和关系: 表1 两类授权的区别 名称 核心关系 涉及的权限 授权方式 适用场景 角色与策略授权 用户-权限-授权范围 系统角色 系统策略 自定义策略 为主体授予角色或策略 核心关系为“用户-权限-授权范围”,每个用户根据所需权限和所需授权范围进行授权,无法直接给用户
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
通常来源于组件性能图表或接口性能数据。 接口调用次数、请求平均时延、错误调用次数、请求吞吐量等 接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等
给用户组授权之前,请您了解用户组可以添加的自动化运维权限,并结合实际需求进行选择。若您需要对除自动化运维之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。 示例流程 图1 给用户授权自动化运维权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予自动化运维只读权限“CMS ReadOnlyAccess”。
个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 配置AOM告警规则
troCanvas(有效期为一个月)。自定义业务指标监控大屏前,需要先开通模板,模板开通后才能编辑该模板。 步骤二:监控AOM系统指标数据 将AOM系统监控数据(如告警数据、Prometheus监控数据等),呈现在业务指标监控大屏页面上。 步骤三:自定义业务指标监控大屏 根据自身
diskPartition 磁盘分区。 diskPartitionType 磁盘分区类型。 文件系统指标 clusterId 集群ID。 clusterName 集群名称。 fileSystem 文件系统。 hostID 主机ID。 mountPoint 挂载点。 nameSpace 集群的命名空间。
告警行动规则:通过创建告警行动规则关联SMN主题与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 告警通知:通过创建通知规则关联接收对象与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 告警降噪:在发送告警
放。 服务已接入需要的APM应用。 登录APM控制台接入一个APM应用时,系统会自动创建一个APM类型的Prometheus实例并显示在AOM控制台的“Prometheus监控 > 实例列表”界面。 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警
3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0.5时,生成紧急告警。 图3 设置告警规则详情 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。告警通知策略有两种方式,如图4所示,此处选择直接告警方式。 直接告警:满足告警条件,直接发送告警。选择直接告
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”
行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes