检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“指标”下拉框中选择云服务中需要监控的指标,并在“条件”下拉框中选择步骤一添加的标签,即可查看云服务指标与标签是否接入。如图2所示,DCS服务的指标“CPU利用率”和标签“Ihn”已成功接入。 图2 查看指标 单击指标列表右上角的,为选择的指标新增告警规则。 设置告警规则的规则名称等基本信息。 表1
fill_value 否 String 用于对查询到的时序数据进行断点插值,默认值为-1。 -1:断点处使用-1进行表示。 0 :断点处使用0进行表示。 null:断点处使用null进行表示。 average:断点处使用前后邻近的有效数据的平均值进行表示,如果不存在有效数据则使用null进行表示。
此卡片主要展示了3种信息: 统计最新时间前1分钟内的主机的磁盘读/写速率在TOP5的主机信息。 最近1小时内的所选主机的磁盘读/写速率的趋势图,趋势图的每一个点分别表示1分钟内主机的磁盘读/写速率的值。 趋势图上方的值为所选主机的磁盘监控的最新时间点主机的磁盘读/写速率的值。 主机监控(网络)卡片 图8
相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。 pod的内存实际使用率的普罗语句如下所示: sum(aom_container_memory_used_megabytes{podID="****1461-41d8-****-bfeb-fc1213****"
AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对应的日志存储时长、大小和计费方式不同,详见收费详情。 日志流量 日志流量指的是每秒上报的日志大小。每个租户在每个Region的日志流量不
APM_AK/APM_SK:安装JavaAgent的AK和SK。获取AK和SK方法参见访问密钥。直接复制安装JavaAgent的命令,请注意填写“APM_AK”和“APM_SK”时,需删除“{}”。 master.address:APM探针接入地址,请参见探针接入地址。 支持通过配置环境变量的方式动态配置安装J
e_megabytes) 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) 可用虚拟内存(aom_node_virtual_memory_free_megabytes) 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(MB) 显存容量(aom
标。 需要监控某个成员账号的指标,则单击“成员账号”文本框,在弹出的搜索框中输入账号关键字,下面的账号树中自动显示相关的成员账号,根据需要勾选需要监控的成员账号即可。 需要停止监控某个成员账号的指标,则在“账号接入”界面的“成员账号”文本框中删除对应的成员账号。 接入云服务:从云
ICAgent会加密存储您的AK/SK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prom
Service,简称OBS)的OBS桶中,以便进行长期存储。如果您有更长时间的日志存储需求,可添加日志转储。 AOM提供周期性转储和一次性转储两种转储方式,供您选择使用。 周期性转储:将当前日志实时转储到OBS桶中,且以转储周期为粒度对1天的日志进行分割,同一时间段的日志将转储到其对应的日志文件中。
ICAgent会加密存储您的AKSK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prome
TopN:统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU使用率,那
添加成功后,指定资源当前新产生的日志将会实时转储到OBS桶中。 例如,als0320a当前新产生的日志会实时转储到OBS桶obs-store-test的/home/Periodical Dump目录下,且每3个小时的日志转储到其对应的日志文件中。 将存储在OBS中的日志文件下载到本地,以供定位问题使用。
开启该功能后,将按照一定的比例将图标缩小,并增加折线图。 TopN:统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表
输入搜索条件或关键字,从CMDB服务中选取实例。当前节点类型支持两种选择方式,静态IP和动态节点。 静态IP:可选中指定CMDB应用下的CCE实例。 动态节点:选择CMDB应用中的节点,从而动态获取节点下的CCE实例。该方式对节点下未来新增的实例也生效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。
从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可单击“新建分组规则”添加,具体操作请参见分组规则。 图3 设置告警降噪方式 单击“立即创建”,完成创建。如下图所示,创建了一条阈值规则,单击其前的,可对其下的多个资源的同一指标批量监控。 在展开的列表中,只要某个主机的指标数据
脚本参数 配置自定义插件脚本的默认参数的属性。您可以根据实际需求,配置脚本参数的属性信息如下: 必填:开启该按钮,插件调试中的参数值为必填项;关闭该按钮,插件调试中的参数值可不填写。 参数名:脚本参数的名称。当配置了“默认脚本参数”后,会根据“默认脚本参数”中自定义的参数自动识别脚本参数名称,此处灰化,不可配置。
单击告警条件后的,可将对应行的指标数据和告警条件转换为Prometheus命令。 单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。 单击告警条件后的,可删除对应行指标数据的监控。 图8 设置告警规则详情 表5 告警规则详情填写说明 参数名称 参数说明 多指标 按设置的多个指标
行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段