检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
Exporter接入AOM实现指标监控 Memcached Exporter接入AOM实现指标监控 MongoDB Exporter接入AOM实现指标监控 ElasticSearch Exporter接入AOM实现指标监控 Redis Exporter接入AOM实现指标监控
Exporter接入AOM实现指标监控 Memcached Exporter接入AOM实现指标监控 MongoDB Exporter接入AOM实现指标监控 ElasticSearch Exporter接入AOM实现指标监控 Redis Exporter接入AOM实现指标监控 CCE容器场景自建中间件接入AOM方案概述
不分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本
添加自定义标签字段 添加自定义标签字功能目前仅在华东-上海一开放。 通过添加自定义标签,用户可以在日志页面上查看到自定义标签,如果将aom日志接入lts后,可以通过该自定义标签关键字进行日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadat
、KUBERNETES)。 枚举值: default ECS VPC CCE REMOTE_WRITE KUBERNETES CLOUD_SERVICE ACROSS_ACCOUNT prom_version String Prometheus实例版本号。 prom_create_timestamp
工具市场 工具市场会按照场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:脚本管理、文件管理。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。
数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
系统预置的仪表盘模板都保存在“系统内置”分组下,包含容器、云服务、原生中间件、应用。预置仪表盘不允许删除或调整分组,仪表盘模板不支持创建。 系统预置的容器类型仪表盘需要在CCE集群下的“插件管理”中安装“kube-prometheus-stack”插件后,才能正常使用。 系统预置的原生中间件类型仪表盘需要在UniAg
不分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本
运行或使系统进入到不可恢复的状态 service xxx restart/stop command \\s*service\\s+.*\\s+(restart|stop)\\s* service network stop 命令中包含service xxx restart/stop
CBH,ER,GaussDB for MySQL,DCS,RDS,OBS,DMS,ELB,NAT,VPC,GaussDB DWS,LakeFormation,WAF,DRS,DDS,DC,CSS,EVS,CBR,APIG)以及ICAgent采集的CCE和ECS指标。 步骤一:被监控账号接入云服务资源
据。 可能原因 Grafana配置参数错误。 解决方法 登录云容器引擎控制台(旧版)。 左侧导航栏选择“资源管理 > 网络管理”,在Service页面获取Grafana服务的访问地址和端口,以及Prometheus服务的访问域名和端口。 左侧导航栏选择“配置中心 > 配置项”,在
SVCSTG.INV.5000001 The Elasticsearch session is null. Elasticsearch会话为空 请联系技术支持工程师解决。 500 SVCSTG.INV.5000002 The Elasticsearch execution is abnormal
4000115 Invalid request parameter. 请检查参数。 SVCSTG.INV.5000002 The Elasticsearch execution is abnormal. 请联系技术支持工程师解决。 SVCSTG.INV.5000003 The call
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
talMemorySegments TaskManager中分配的内存segments的总数。 无 Default shuffle service flink_taskmanager_Status_Shuffle_Netty_AvailableMemorySegments Tas