检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。
在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。 设置搜索条件
tal DNS请求次数 coredns_dns_request_do_count_total 设置了DO标志位的请求总数 coredns_dns_do_requests_total 设置了DO标志位的请求总数 coredns_dns_request_type_count_total
费用账单 您可以在“费用中心 > 账单管理”查看资源的费用账单,以了解该资源在某个时间段的使用量和计费信息。 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,应用运维管理的按需
合开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。 为了快速了解并进行中间件及自定义插件接入AOM服务,建议您按照如下步骤进行操作: 给虚机安装采集器底座UniAgent,用于安装Exporter,并创建采集任务。详情请参考:安装UniAgent。
Nginx指标接入AOM 您可以直接使用AOM提供的Nginx Exporter插件给主机创建采集任务,并安装Nginx Exporter插件,就可以监控Nginx相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 已启用NGINX
Nginx指标接入AOM 您可以直接使用AOM提供的Nginx Exporter插件给主机创建采集任务,并安装Nginx Exporter插件,就可以监控Nginx相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 已启用NGINX
新创建。 设置通知策略 阈值规则的状态(正常、超限阈值、数据不足)发生变化时,如需使用邮件或短信等方式发送通知,请参考下面操作在SMN界面设置通知策略。如不需接收邮件或短信通知,请跳过下面操作。具体操作如下: 创建一个主题,操作详见创建主题。 设置主题策略,操作详见设置主题策略。
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执
ICAgent安装成功后,无法在界面上获取到ICAgent状态 问题描述 ICAgent安装成功后,无法在界面上获取到ICAgent状态。 原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。
采集配置名称 自定义指标接入规则名称。长度范围为1到50个字符,支持大小写字母,数字,特殊字符(_-),以字母开头。 指标抓取规则 采集目标 设置采集普罗指标的目标端IP地址和端口号,例如:10.0.0.1:3306。 指标采集间隔(秒) 指标采集的周期,单位为秒(s),默认为60s,可选择10、30和60。
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。
中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。
自定义静态阈值模板。 输入模板名称,选择资源类型,设置指标名称、统计方式、阈值条件等参数。 统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。
go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大,这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC
您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击响应
通知消息。 接收渠道:接收告警通知的渠道。当接收对象选择主题订阅时,不涉及此参数设置。 单击“添加范围”,可以添加多个通知范围。 单击“删除”,可以删除添加的通知范围,至少需要设置1个通知范围。 设置完成后,单击“确定”,即可成功创建告警行动规则。您还可以执行以下操作: 前往“告
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 应用性能监控告警规则 通过创建应用性
快速查询日志流中的日志 当您需要重复使用某一关键字搜索日志时,可以将其设置为快速查询语句。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“原始日志”页面单击,设置快速查询参数,具体的参数说明如表1所示。 图1 创建快速查询 表1 快速查询参数说明 参数名称