检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置密钥的详细操作可参考创建密钥。 ElasticSearch连接串的格式为 <proto>://<user>:<password>@<host>:<port>,也可以不设置密码。 YAML配置示例如下,密码已按照Opaque加密: apiVersion: v1 kind: Secret
删除接入规则或删除映射日志流不可恢复,请您谨慎操作。 重复映射 如果将同一个工作负载或文件映射分别映射到日志流A和B中,最新日志将同时上报至流A和流B,AOM会出现流A和流B重复的日志,同时重复产生的日志会被计费,因此不建议重复配置。 图5 重复映射 父主题: 接入LTS
安装ICAgent ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装。 AOM和LTS使用的ICAgent功能完全相同,ICAgent采集的指标数据均上报到
1的环境变量。checkType为scope时checkMode填equals,checkContent格式为节点ID数组["hostId1","hostId2"],表示规则仅会在这些节点上生效(如果不指定节点范围,规则将下发到该项目所有的节点)。 isDefaultRule 是
设置完成后,监控的指标数据以折线图形式显示在告警条件上方。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 表3 告警规则详情填写说明 参数名称 参数说明 示例 多指标 按设置的多个指标数据和对应告警条件逐条计算,只要满足一个条件则触发告警。 多指标 指标 需要监控的指标。单击“
权限策略和授权项 权限和授权项说明 策略授权参考
常用的普罗命令 指标 标签定义 PromQL 主机CPU使用率 {nodeIP="",hostID=""} aom_node_cpu_usage{nodeIP="192.168.57.93",hostID="ca76b63f-dbf8-4b60-9c71-7b9f13f5ad61"}
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。
磁盘分区指标 aom_host_diskpartition_thinpool_metadata_percent Thin pool 元数据空间使用率 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) aom_host_diskpartit
"contsssner-0", "hostIP" : "1xx.xxx.0.1xxx", "hostId" : "c11xxxxx11-0000b-4925-bef4-d0xxxx9b0", "hostName" : "1x2.168.0.xxx"
统计周期为1分钟和5分钟。 以“仪表盘”页面为例,时间范围与统计周期的关系如下表所示。 表1 时间范围和统计周期关系表 时间范围 统计周期 近30分钟 1分钟、5分钟 近1小时 近6小时 1分钟、5分钟、15分钟、1小时 近1天 近1周 1小时 自定义时间段 1分钟、5分钟、15分钟、1小时
"amm_node_status", "clusterId" : "000000-0000-0000-0000-0000000", "hostID" : "c9xxcb-2x6c-4h54-8fcd-f68xx85", "nameSpace" : "default"
"clusterId" : "00000000-0000-0000-0000-00000000", "hostID" : "g947xcxh-2xcxc-xxx-xxcd-f6xxx85", "nameSpace" : "default"
义了查询的时间间隔,用于将查询的时间范围分割成多个小段,然后对每个小段进行求值。step参数需要与数据采集的频率相匹配,以确保数据的准确性和一致性。如果step设置得太小,可能会导致查询性能下降;如果设置得太大,则可能错过某些细节。 请求参数 表3 请求Header参数 参数 是否必选
0,还需要再单独申请AOM 2.0的操作权限,具体请参见开通AOM 2.0。 AOM 2.0与AOM 1.0的功能有哪些区别? AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动
系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件 根据需要设置告警标签和告警标注信息,为告警匹配分组,后续可关联告警降噪策略来发送告警通知。详细说明请参见标签和标注。 单击“添加自定义标签”或“添加自定义标注”可添加多条信息。 设置告警通知策略。告警通知策略有两种方式,请根据需要选择:
直接接入方式仅支持华北-北京四、华东-上海一、华东-上海二、华南-广州区域区分内网和公网。 直连接入(内网) 安装命令 安装UniAgent的命令,分为LINUX和WINDOWS。 说明: 当前支持通过创建终端节点和AOM/LTS服务打通网络,进行心跳和指标上报,以及日志上报。目前仅通过原采集管理入口手动安装UniAgent时支持创建终端节点。
一个主机最多可添加5个标签,且标签键不能重复。 不同主机可添加同一个标签。 通过创建CCE、ServiceStage集群时创建的主机,不支持添加自定义集群和别名。 主机状态包含“正常”、“异常”、“亚健康”、“通道静默”、“已删除”。当由于网络异常、主机下电、关机等原因导致的主机异常,或主机产生阈值告警时,主机状态为“异常”。
传,不可修改 region 否 String 环境关联region。创建环境必传,不可修改 register_type 否 String 注册类型,取值:API、SERVICE_DISCOVERY、CONSOLE,默认值:API 响应参数 状态码: 200 表3 响应Body参数