检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。 命令行输入:提供手动输入和系统自动填充两种输入方式。
本地浏览器时间和ECS时间一致。 安装ICAgent 登录AOM控制台,选择“配置管理 > Agent管理”。 单击“安装ICAgent”,主机类型选择“华为云主机”,安装方式选择“获取AK/SK凭证”。 单击“复制命令”复制安装命令。 通过ECS控制台提供的远程登录方式登录ECS。 登录E
登录AOM 1.0控制台 。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“其他:用户自定义接入主机”。 选择主机后,单击“升级ICAgent”。 从下拉列表选择合适的AOM 2.0目标版本,单击“确定”。 ICAgent开始升级,升级ICAge
登录AOM 1.0控制台。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“其他:用户自定义接入主机”。 选择主机后,单击“升级ICAgent”。 从下拉列表选择合适的AOM 2.0目标版本,单击“确定”。 ICAgent开始升级,升级ICAge
配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。 UniAgent管理 UniAgent相关API,包括下发批量安装,升级UniAgent任务,以及查询UniAgent主机列表接口。 仪表盘 仪表盘相关API,包括查询,删除仪表盘等接口。
Set Size)。 ≥0 兆字节(MB) 下行Bps(aom_container_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_container_network_receive_packets)
的pod实例、主机或告警信息。如果该时间范围内不存在相关数据,AOM会自动跳转到“组件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可监控业务进程或组件pod的资源占用与健康状态。 在“主机列表”页签,可查看该组件所在的主机概况。 在“告警分析”页签,可查看该组件的告警情况。
本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。 CCE容器场景自建中间件接入AOM实现指标监控 Prometheus监控服务提供了多种常用中
onsole/upgrade/batch-upgrade aom:uniagentAgent:upgrade √ x 查询UniAgent主机列表信息 POST /v1/uniagent-console/agent-list/all aom:uniagentAgent:list √
单击应用名称,在“应用详情”页面,以应用维度对组件进行批量管理与监控。 您还可查看当前应用包含的组件列表、主机列表和告警分析。 在“应用详情”页面右上角可设置查询时间范围,查询该应用的组件、主机或告警信息。如果该时间范围内不存在相关数据,AOM会自动跳转到“应用监控”的主操作界面。 在日常
AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明 告警管理
解决Docker节点标准输出日志Json解析问题(没有去掉转义字符)。 2024-01-31 5.12.170 主机日志,容器日志,标准输出日志支持增量采集。 解决主机gpu指标挂断问题。 2024-01-29 5.12.166 解决标准输出日志采集插件占用内存高问题。 解决虚机日志采集插件重复采集绕接文件问题。
虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
表1 AOM 2.0与AOM 1.0版本的功能特性对比 功能项 功能项说明 AOM 1.0 AOM 2.0 应用资源管理 资源检索 提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 不支持 支持 应用管理 管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+
对某个资源进行监控。 如下图所示,对于一个单条阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。 图3 单条阈值规则 更多阈值规则操作
s实例的Remote Write Prometheus配置代码。 图1 Remote Write Prometheus配置代码 登录ECS主机,配置prometheus.yml文件。 通过以下命令找到并启动prometheus.yml文件。 ./prometheus --config
操作 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、企业项目、应用环境、UniAgent状态、资源状态、镜像名称、VPC名称。 单击“名称/ID”列的某个资源名称,展示“主机详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。
时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。
在左侧导航栏中选择“作业管理”,单击右上角的“新建作业”。 设置“添加全局参数”,创建参数类型为“字符串”的参数 param1, 创建参数类型为“主机列表”的参数param2,并保存。 创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选
日志读写流量 500MB 400GB 1TB 日志索引流量 500MB 400GB 1TB 日志存储空间 500MB 400GB 1TB 主机监控 指标存储7天 100VM,指标存储时长1年 200VM,指标存储时长1年 CCI实例监控 指标存储7天 500实例,指标存储时长1年