检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus监控 如何将Prometheus数据接入到AOM? Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标?
AOM 最佳实践一览表 最佳实践 说明 建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 通过告警降噪清除告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
在左侧导航栏选择“委托”,单击右上方的“创建委托”。 在创建委托页面,设置委托参数。 “委托名称”以“iam_for_aom”为例,“委托类型”必须选择“普通账号”,“委托的账号”填写“DomainA”,“持续时间”选择“永久”,单击“下一步”。 设置最小授权范围,选择“AOM ReadOnlyAcc
效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。
n信息实现环境的过滤,也可以在创建环境时打上一个或多个标签,通过标签进行环境过滤。例如按照环境类型区分包括:正式、测试。 环境标签 为环境设置的一个属性,多个环境可能具有相同的的标签,通过标签可过滤显示需要的环境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定
常见计费问题 如何查看每天的自定指标上报量? AOM控制台的“资源消耗”界面会展示每天指标上报量展示,具体操作请参见统计资源消耗。 如何查看有哪些Prometheus指标? 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2
操作场景 您可以接入自定义 Prometheus 格式指标,用于采集JVM指标,并支持自动上报。 前提条件 已接入ECS类型Prometheus监控,详情请参见创建ECS Prometheus实例。 已创建主机组,详情请参见管理主机组。 如需使用自定义 Prometheus 格式指
需要单击页面右上角“体验新版”,切换至新版仪表盘界面。 选择待操作的仪表盘,在对应“仪表盘”页面右上角单击,进入“变量设置”页面。 单击“新增变量”,参考表1设置相关参数。 表1 新增变量填写说明 参数名称 说明 变量名称 变量的名称。最多可输入255个字符,只能包含数字、字母、下划线,且不能以下划线开头和结尾。
应用服务整体流量不均。 功能入口 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式
告警管理 如何区分告警和事件?
template.metadata.annotations代码段。 图3 编辑yaml文件 在代码段中按照实际需要依次设置相关参数,具体的参数说明请参见表1,设置完成后如图4所示。 表1 设置参数信息 参数名称 参数说明 是否必选 默认值 aom.application.name 应用名称。 是
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
ICAgent管理(非华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之间是“和
其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)