检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建AOM事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name string 策略名称 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述
用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层
ER、分布式消息服务 DMS、分布式缓存 DCS、专享版API网关 APIG、云数据库 GaussDB(for MySQL)、云数据库 GeminiDB、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务 DRS、AI平台 ModelArts、湖仓构建 LakeFormation、表格存储服务
必选 application/json;charset=utf-8 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 响应消息 响应参数 响应参数如表3所示。 表3 响应参数 参数名称 参数类型
第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 应用场景 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简
云容器引擎CCE - 工作负载 负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 集群 集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。 文档数据库DDS - 名称/ID、资源状态
兆字节(MB) 显存使用率(aom_node_gpu_memory_usage) 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) 显存使用量(aom_node_gpu_memory_used_megabytes) 该指标用于统计测量对象已使用的显存。
置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 单击“分词配置”页签。 分词配置 ICAgent采集 为了减少内存、数据库和磁盘空间占用,您可以按需进行ICAgent采集设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。 在左侧导航栏
0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。 日志数据的相关费用统一
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name String 策略名称。 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述
ResourceType 资源类型 必选 默认值为app,app表示给应用修改策略组属性 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 请求参数 请求参数如表3所示。 表3 请求参数 参数名称 参数类型 描述 max_instances
Exporter。 在左侧导航栏中选择“工作负载”,在右上角单击“创建负载”,选择“负载类型”为无状态工作负载Deployment,选择需要的命名空间部署Kafka Exporter。 如果以YAML的方式部署Exporter,更多 Exporter详细参数介绍请参见 kafka-exporter,YAML配置示例如下:
Exporter可以采集监控数据并通过Prometheus监控规范对外提供数据。 图2 安装Exporter 参数 说明 postgre用户名 PostgreSQL的用户名称。 postgre密码 PostgreSQL的密码。 postgre地址 PostgreSQL的IP地址和端口号,例如:10
Exporter可以采集监控数据并通过Prometheus监控规范对外提供数据。 图2 安装Exporter 参数 说明 postgre用户名 PostgreSQL的用户名称。 postgre密码 PostgreSQL的密码。 postgre地址 PostgreSQL的IP地址和端口号,例如:10
单击“免费开通服务并授权”,即可免费开通AOM 2.0服务。 在页面上方的左侧导航栏单击任意一个功能名称,如“仪表盘”,可进入该功能的操作界面。 父主题: 迁移AOM 1.0数据至AOM 2.0
关闭 用户自定义ServiceMonitor或PodMonitor配置采集指标并上报指标到AOM,产生相关费用。比如容器场景自定义中间件mysql、nginx、业务指标等。 云服务场景 云服务接入AOM Prometheus实例后,部分云服务产生计费。具体如下: 不计费云服务:Mo
最多可输入255个字符,不能包含特殊字符"$#%&'+;<=>?\ 数据来源 单击“指标源”选择指标数据作为数据来源。 图表类型 指标图表可选择的图表类型,包括:折线图、数字图、TopN、表格、柱状图、数字折线图。 添加方式 按照需要添加指标数据。添加指标数据的方式有两种:全量指标、按普罗语句添加。 全量指标
传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制 如需使用“应用
安装UniAgent(新版) 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。 AOM支持对