检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM提供告警规则和事件规则设置功能。通过创建指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则 通过指标告警规则可对资源的指标设置阈值条件
装成功。 如果ICAgent状态为“离线”或其他状态,则请单击状态后的“详情”查看ICAgent安装失败的原因,可能是输入的AK/SK错误或ECS委托设置错误等原因导致,请获取正确的AK/SK或正确设置ECS委托后重新安装。如果还未安装成功,则请提交工单处理,操作详见如何提交工单。
表示重要告警。 :表示次要告警。 :表示提示告警。 单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表5。 表5 “高级设置”填写说明 参数名称 参数说明 示例 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。
通过添加自定义标签,用户可以在日志页面上查看到自定义标签,如果将aom日志接入lts后,可以通过该自定义标签关键字进行日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadata:annotations:下增加以下字段来实现 kubernetes
表示提示告警。 单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表6。 表6 “高级设置”填写说明 参数名称 参数说明 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。
是您手动配置的应用发现规则名称,说明应用由您自定义的发现规则发现。 设置搜索条件搜索要查看的组件。 不支持通过别名搜索组件。 单击组件名称,进入“组件详情”页面。 在“组件详情”页面右上角可设置查询时间范围,查询该组件的pod实例、主机或告警信息。如果该时间范围内不存在相关数据,
String 日志单行序列号第一次查询时不需要此参数,后续分页查询时需要使用可从上次查询的返回信息中获取. pageSize/size 否 String 表示每次查询的日志条数不填时默认为5000,建议您设置为100。 第一次查询时使用pageSize 后续分页查询时使用size。 searchKey
在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证ElasticSearch Exporter是否部署成功,有指标数据返回则表示ElasticSearch
元数据查询 功能介绍 该接口用于查询指标的元数据。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/metadata 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的
图表0的查询语句:$event.annotations.results[0].sql 图表0的查询时间:$event.annotations.results[0].time 图表0的查询URL:$event.annotations.results[0].url 图表0的查询日志:$event
进程监控”,进入应用监控界面,查看应用列表。 在应用列表上方搜索框中设置过滤条件,可以实现应用列表过滤显示。 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置应用信息的统计条件。 设置时间范围,查看已设时间范围内应用。可通过如下两种方式设置时间范围:
某次执行的具体信息。 图1 方法分析详情 查看执法记录:页面左侧展示该方法的执行记录,包括:耗时明细、调用来源以及方法源码。 耗时明细展示调用方法、耗时时间并支持“下钻”操作。 单击操作列的“下钻”,可以查看此调用方法的详细信息。 查看默认观测项目:页面右侧展示默认观测项目,包括:Parameters、Return
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
> 应用监控”,查看应用列表。 可以在应用列表上方设置过滤条件,实现应用列表过滤显示。 单击应用名称,在“应用详情”页面,以应用维度对组件进行批量管理与监控。 您还可查看当前应用包含的组件列表、主机列表和告警分析。 在“应用详情”页面右上角可设置查询时间范围,查询该应用的组件、主
图所示,展示了主机CPU使用率Top5: 图6 资源TopN图表 默认展示资源Top5图表,通过单击“显示Top15”、在图表任意处双击或在“操作”列选择“放大”,均可查看资源Top15图表。 如果您需监控所有集群下的所有资源的Top5数据,可在“监控概览”界面查看,也可将“监控
接入云服务前,需要先为云服务选择所属的企业项目。如果事先已在全局页面选择具体的企业项目,此处无需再设置。如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 图1 查看云服务信息 在云服务实例列表右上角可设置筛选条件或按实例名称、ID等设置搜索条件,实现云服务实例过滤显示。 单击右上角的,可实时获取到该云服务全部实例的最新信息。
在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证Memcached Exporter是否部署成功,有指标数据返回则表示Memcached
表示提示告警。 单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表3。 表3 “高级设置”填写说明 参数名称 参数说明 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。
、以及聚合维度查询条件,即可以查看该实例对应的性能分析数据。 查询参数设置请参考下表: 表4 查询参数说明 选择项 参数 说明 类型 CPU Time 每个方法在CPU上的运行时间。 Allocated Memory 已分配的堆内存(包括已被回收和未被回收的部分),使用场景包括频繁GC(Garbage