检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM
仪表盘 查询仪表盘列表 删除仪表盘 查询仪表盘详情 查询仪表盘分组列表 删除仪表盘分组 父主题: API
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。
安装UniAgent(新版) 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。
添加日志桶 日志桶是对日志文件逻辑上的分组。用于以日志桶为单位查看日志等,使用这些功能前您需先添加一个日志桶。 注意事项 每个日志桶最多可添加500个日志文件。 同一个日志桶中只能添加同一个集群的日志文件。 添加日志桶 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”。
配置AOM应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用、组件和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则说明发
安装UniAgent(新版) 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。
ECS主机上执行UniAgent安装命令,下载安装脚本失败 问题描述 在通过华为云购买的ECS主机上执行UniAgent安装命令时,下载安装脚本失败,出现如下报错信息:Cloud not resolve host: aom-uniagent-xxxxxxxxxxxxxxxxxxxxxxxxxxxx。
资源分组 AOM支持按企业项目以及资源细粒度对资源进行分类管理,帮助用户快速管理和使用资源。 资源分组最多可以创建100个。 创建资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 单击右上角的“创建资源分组”。 根据界面提示配置参数,具体如表1所示。 表1 配置参数
自动化运维(aom2.0接口) 创建任务 更新任务 对暂停中的任务进行操作 获取工作流执行中的执行详情 终止任务执行 脚本查询 脚本版本查询 作业管理主页模糊查询 根据作业id查询方案(自定义模板)列表 获取方案信息 查询任务列表 获取任务执行历史 执行工作流 父主题: API
创建AOM事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
管理Prometheus实例指标数据 AOM支持查看CCE类型、ECS类型、云服务类型、通用实例、APM类型与default类型Prometheus实例的指标,以及新增指标和废弃指标。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
创建通知规则 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您
如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
Memcached Exporter接入AOM实现指标监控 应用场景 使用Memcached过程中需要对Memcached运行状态进行监控,以便了解Memcached服务是否运行正常,排查Memcached故障等。Prometheus监控服务提供了CCE容器场景下基于Export