检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。 表1 高危命令说明 高危命令名称 高危命令校验规则 样例 导致风险 vi /etc/xxx.xx command \\s*(vi|vim)\\s+/
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值
该主机无法解析obs域名,导致无法下载UniAgent的安装脚本。 解决办法 指导用户为Linux系统的ECS主机配置DNS域名解析,并添加安全组,以解决下载UniAgent安装脚本出现域名无法解析问题。 修改ECS主机的DNS配置有两种方式:命令行和管理控制台;您可以根据自己的使用习惯选择其中一种方式进行配置。
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 问题描述 通过helm部署pod的yaml文件后,AOM无法检测到工作负载。 原因分析 通过对比helm部署pod的yaml文件和在CCE控制台部署的pod yaml文件,发现helm部署pod的yaml文件中缺少env参数。
Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。
Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且接入方式选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125.12
Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且源代码选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125.12
AOM提供应用接入功能,通过快速接入Agent,实现数据的自定义接入。 前提条件 部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且源代码选择“增强型探针”的连通性为例,请登录
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查30200、30201端口的连通性。 curl -k
查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查30200、30201端口的连通性。 curl -k
计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作: 单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将对应行的指标数据和告警条件转换为Prometheus命令。 单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。
Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,执行以下命令检查Nginx是否已经启用stub_status模块(一般在
该指标用于统计测量对象的NPU存储容量。 说明: 仅支持CCE类型主机的NPU指标采集。 >0 兆字节(MB) aom_node_npu_memory_usage NPU存储使用率 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 说明: 仅支持CCE类型主机的NPU指标采集。 0~100 百分比(%)
可使用Telnet命令测试目标机器与APM服务器网络是否连通。 例如,以检查华北-北京四区域,且接入方式选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125.12.108:41333,其他区域地址请参考接入地址。 访问地区和终端节点,获取所在region的endpoint。
磁盘分区指标 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 如果ICAgent存在严重的bug时,系统会对采集的版本进行升级。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中
查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查8149端口的连通性。 curl -k
以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址 执行以下命令,查看IP地址对应的网卡,如图2所示。 ifconfig
ICAgent会加密存储您的AKSK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prome