检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题
Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
等待大约两分钟后,您可在左侧导航栏中选择“监控 > 组件监控”,在集群下拉列表框中选择主机,找到已被监控的组件。 查看应用状态 在左侧导航栏中选择“监控 > 应用监控”。 单击应用名称查看应用下面相关资源与组件信息。 图1 查看应用状态 在“组件列表”页签查看应用下面组件列表。 图2 查看组件列表
应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务 立即使用 成长地图 由浅入深,带您玩转AOM
"group" : "ecs_instance", "ecs_id_list" : "[\"xxx\"]", "ecs_instance_status" : null, "ecs_instance_tags" : null, "ecs_inst
应用运维管理AOM API 使用AOM的OPEN API上报指标数据。具体操作请参见:使用API将指标接入(AOM)。 云日志LTS API 使用LTS的OPEN API上报日志数据。具体操作请参见:使用API将日志接入 (LTS)。 应用性能监控APM API 使用APM的OPEN A
”类型中的“Nginx”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例名称,进入目标实例详情页的“接入中心”页面,选择“Nginx”卡片。 在配置页面中,参考下表配置采集任务相关参数信息,并单击“下一步”。
”类型中的“Nginx”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例名称,进入目标实例详情页的“接入中心”页面,选择“Nginx”卡片。 在配置页面中,参考下表配置采集任务相关参数信息,并单击“下一步”。
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" }, "annotations" : {
希望人员拥有AOM的使用权限,但是不希望其拥有删除应用发现规则等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用应用发现规则,但是不允许删除应用发现规则的权限策略,控制其对应用发现规则资源的使用范围。 如果华为云账号已经能满足您的使用需求,不需要创建独立的
0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果您进入的是新版接入中心,需单击页面右上角“返回旧版”,进入旧版接入中心。) 在右侧“应用层”类型中单击需要接入的卡片,参考下表执行相关接入操作。 表1 应用层接入AOM 卡片 相关操作 Java 在“接入应
的分词符进行处理。 配置分词 在左侧导航栏中选择“配置管理 > 日志配置”,选择“分词配置”页签。 配置分词。 AOM提供了如下两种配置分词的方法。若同时使用了这两种配置方法,则分词符取并集。 自定义分词符:单击,在文本框中输入分词符,单击。 使用ASCII码:单击“添加特殊分词
统计最新时间前1分钟内的组件的CPU使用率、内存使用率在TOP5的组件信息。 最近1小时内的所选组件的CPU使用率、内存使用率的趋势图,趋势图的每一个点分别表示1分钟内组件CPU&内存使用率的值。 趋势图上方的值为所选组件下监控的最新时间点CPU&内存使用率的值。 在卡片左下角通过勾选“隐藏系统组件”可隐藏系统组件。
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss.icAgent.trace
类型中的“Consul”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例名称,进入目标实例详情页的“接入中心”页面,选择“Consul”卡片。 在配置页面中,参考下表配置采集任务相关参数信息,并单击“下一步”。
类型中的“Consul”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例名称,进入目标实例详情页的“接入中心”页面,选择“Consul”卡片。 在配置页面中,参考下表配置采集任务相关参数信息,并单击“下一步”。
概述 接入管理提供监控数据上报的网络通道建立和解除,以及监控数据上报使用的认证凭据生成和吊销等功能,帮助您快速的将监控数据接入到AOM。 本功能当前开放区域为:华北-北京一、华北-北京二、华东-上海一、华南-广州、中国-香港、亚太-新加坡,华东-上海二,华北-北京四,西南-贵阳一
通过cmdb树选择云服务资源执行任意任务时失败,提示:Access denied, The {ECS Instance/RDS Instance/WorkLoad} does not belong to the current project, {ECS Instance/RDS Instance/WorkLoad}
的“RabbitMQ”卡片,并单击卡片上的“接入指标(AOM)”。 入口二:选择“Prometheus监控 > 实例列表”,单击ECS类型的Prometheus实例名称,进入目标实例详情页的“接入中心”页面,选择“RabbitMQ”卡片。 在配置页面中,参考下表配置采集任务相关参数信息,并单击“下一步”。