检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
接入中心页面区分旧版和新版。如果进入旧版接入中心后,想要使用新版接入中心页面,单击“接入中心”页面右上角“体验新版”,即可进入新版接入中心。 如果进入旧版接入中心页面,直接单击“Prometheus 中间件”类型中的“MongoDB”卡片。 如果进入新版接入中心页面,需筛选出“自建中间件”类型中的“MongoDB”
以通过安装社区中的Exporter,将CCE容器场景自建中间件接入AOM。 常用中间件Exporter接入AOM 表1 常用中间件Exporter接入AOM 操作指导 说明 PostgreSQL Exporter接入AOM实现指标监控 使用PostgreSQL过程中需要对Post
AOM提供了如下两种配置分词的方法。若同时使用了这两种配置方法,则分词符取并集。 自定义分词符:单击,在文本框中输入分词符,单击。 使用ASCII码:单击“添加特殊分词符”,参考ASCII码对照表输入ASCII值,单击。 预览分词效果。 在文本框中输入待预览的日志内容,单击“预览”。例如,分词符设置为
2.0的计费模式、计费项、欠费等主要计费信息。如果已知资源使用情况,需了解价格预算和计费方式选择,可前往价格计算器预算价格。 计费模式 AOM当前提供按需计费模式,按需计费是一种后付费模式,即先使用再付费,按照云服务器实际使用时长计费。关于按需计费模式的详细介绍请参见计费模式概述。
您可以在“费用中心 > 账单管理”查看资源的费用账单,以了解该资源在某个时间段的使用量和计费信息。 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,应用运维管理的按需计费模式按
在下拉列表中单击“新建分组规则”添加,具体操作请参见创建分组规则。所选择告警降噪的分组规则中配置的告警级别、标签等信息需与告警规则中的配置信息匹配,否则分组规则不生效。 单击“立即创建”,完成创建。创建完成后,单击“查看告警规则”可查看已创建的告警规则。 在展开的列表中,只要指标
行状况。 了解服务 立即使用 成长地图 由浅入深,带您玩转AOM 01 了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎
a。 基础设施监控:支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。 日志管理:提供全场景日志采集、百亿日志秒搜、PB级存储、一站式日志加工、
单个环境管理的同类实例资源数量最多不超过2000。 资源监控使用限制 表2 资源监控使用限制 分类 限制项 说明 仪表盘 仪表盘数量 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表数量 1个仪表盘中最多可添加50个图表。 仪表盘中图表可选资源、阈值规则、组件或主机数量 1个数字图最
管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。 卡片管理 在工具市场页面,可以直接使用卡片创建任务,也可以对非通用场景卡片进行下架、上架或设置操作,具体操作如表1。 如果不需要对卡片做下架、上架或设置操作,请参考自动化运维自定义策略,拒绝卡片修改操作。
AK/SK认证 AK/SK签名认证方式仅支持消息体大小12MB以内,12MB以上的请求请使用Token认证。 AK/SK既可以使用永久访问密钥中的AK/SK,也可以使用临时访问密钥中的AK/SK,但使用临时访问密钥的AK/SK时需要额外携带“X-Security-Token”字段,字段
本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_name
ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss
是否开启云服务标签自动同步: 开启:云服务标签的新增和修改都将同步到接入配置中。默认开启标签自动同步。 关闭:云服务标签的新增和修改不会同步到接入配置中。 设置完成,单击“立即接入”,则将云服务接入到新创建的云服务类型Prometheus实例中。 其他相关操作 您还可以在云服务类型Prometheu
当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志搜索”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。
r_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_container_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读
aom_node_gpu_memory_usage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) aom_node_gpu_memory_used_megabytes 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_node_gpu_usage
例如,用户要调用接口来查询指标,那么在基于角色与策略授权的场景中,这个IAM用户被授予的策略中必须包含允许“aom:metric:get”的授权项,该接口才能调用成功。在基于身份策略授权的场景中,这个IAM用户被授予的权限中包含“aom:metric:list”的授权项,该接口才能调用成功。
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
Thin pool 元数据空间使用率 (aom_host_diskpartition_thinpool_metadata_percent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_host_