检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 查看组件异常日志 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,无法及时从众多告警中及时发现故障,全面掌握应用情况。 解决方案 下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。
分组流程 告警分组流程如图1所示,以分组条件设为“告警级别等于紧急”为例,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
可观测指标浏览 指标浏览展示了各资源的指标数据,您可实时观测监控的指标值及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看及分析业务数据。 监控指标 登录AOM 2.0控制台。 在左侧导航栏中选择“指标浏览”。 从下拉列表选择需要监控的Prometheus实例。 通过“全量指标
安装ICAgent过程中,系统提示“no crontab for root”是什么原因? AOM配置日志转储时无法选中obs桶是什么原因? Grafana无法展示内容是什么原因?
即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。
您购买了裸金属服务器(裸金属服务器操作系统需满足表4中的使用限制,且购买后需要给裸金属服务器安装UniAgent,否则无法使用AOM监控)后,在AOM界面可对裸金属服务器的基础资源和运行在其上的应用进行监控,同时在AOM界面还可查看相关的日志和告警。
如何在VPCEP控制台为AOM/LTS创建终端节点? 当前支持通过创建终端节点和AOM/LTS服务打通网络,进行心跳和指标上报,以及日志上报。如果要通过终端节点的方式打通AOM/LTS的网络,需要为AOM和LTS各自购买1个终端节点。 创建AOM/LTS终端节点的方法: 登录华为云
/文件系统的累积计数 container_fs_usage_bytes 文件系统的使用量 container_fs_write_seconds_total 容器累计写入磁盘/文件系统的秒数 container_fs_writes_bytes_total 容器累积写入磁盘/文件系统数据的总量
您购买了裸金属服务器(裸金属服务器操作系统需满足表1中的使用限制,且购买后需要给裸金属服务器安装ICAgent,否则无法使用AOM监控)后,在AOM界面可对裸金属服务器的基础资源和运行在其上的应用进行监控,同时在AOM界面还可查看相关的日志和告警。
系统策略 - CMS ReadOnlyAccess 自动化运维只读权限,拥有该权限的用户仅能查看自动化运维数据。 系统策略 应用资源管理常用操作与系统权限 表2列出了应用资源管理常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。
添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件。
约束与限制 安装UniAgent支持的Linux操作系统与Windows操作系统,详情请参见操作系统使用限制。
约束与限制 安装UniAgent支持的Linux操作系统与Windows操作系统,详情请参见操作系统使用限制。
添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件,AOM默认为系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp
前提条件 给用户组授权之前,请您了解用户组可以添加的AOM权限,并结合实际需求进行选择,AOM支持的系统权限,请参见AOM系统权限。若您需要对除AOM之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。
系统策略 表2列出了AOM常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。
前提条件 给用户组授权之前,请您了解用户组可以添加的AOM权限,并结合实际需求进行选择,AOM支持的系统权限,请参见AOM系统权限。若您需要对除AOM之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。
文件系统指标 clusterId 集群ID。 clusterName 集群名称。 fileSystem 文件系统。 hostID 主机ID。 mountPoint 挂载点。 nameSpace 集群的命名空间。 nodeIP 主机IP。 nodeName 主机名称。
系统自动填充:不确定指标信息或对Prometheus格式不了解时,可采用系统自动填充方式。系统自动填充方式需要从“指标浏览”界面跳转后填充。 具体操作:在左侧导航栏中选择“监控 > 指标浏览”。