检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置AOM应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用、组件和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则说明发
计费项 计费说明 AOM提供按需计费模式,计费项由自定义指标上报量、指标存储时长、数据转储量的费用组成。具体内容如表1所示。 AOM 2.0仅对上报的自定义指标计费。对上报任意数量的基础指标都是免费的,基础指标请参见:基础指标。 表1 按需计费组成表 计费项 计费说明 计费公式 自定义指标上报量
服务场景概述 服务场景会按照查看场景分类展现对应的已上架的工具卡片,可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作。如果不需要对卡片做下架操作,请参考自动化运维自定义策略,拒绝卡片下架操作。具体操作如表1。 表1 相关操作 操作 说明 收藏卡片 单击待收藏卡片上的。 下架卡片
如何设置全屏模式在线时长? 为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
权限管理 如果您需要对AOM资源给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制AOM资源的访问。
自定义插件接入AOM 您可以创建一个插件,在插件中通过脚本自定义需要上报到AOM的指标数据,并通过该自定义插件创建采集任务,即可采集自定义的指标数据到AOM,以监控该指标数据。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 创建自定义插件
最大长度:32 description 否 String 工作流描述信息。 最小长度:1 最大长度:128 tags 否 Object 标签键和值列表,标签键值对数量范围是0至20。 template_name 否 String 模板名称,示例:CMS::ECS::BulkyRunScript
新增消息通知模板 功能介绍 该接口用于新增消息通知模板。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
在控制台查看不到日志怎么办? 问题描述 在AOM控制台查不到日志。 可能原因 未安装ICAgent日志采集工具。 采集路径配置错误。 AOM控制台上的“日志采集开关”未开启。 AOM控制台上的“超额继续采集日志”开关未开启。 当前账号欠费,故采集器停止采集。 日志流写入速率和单行日志长度超出使用限制。
修改消息通知模板 功能介绍 该接口用于修改消息通知模板。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
监控组件性能指标 设置组件监控开关 查看组件性能指标 通过拓扑图查看组件间调用关系 通过Profiler分析代码性能 通过Debugging诊断代码 查看组件接口调用监控项 查看组件基础监控项 查看组件异常日志 查看组件外部调用监控项 查看组件通信协议监控项 查看组件数据库监控项
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
计费说明 计费说明 应用运维管理服务(简称AOM)提供基础版、按需版两种计费方式。其中按需版分为按量后付费和预付费套餐包(其中预付费套餐包又分为专业版套餐包和企业版套餐包),计费详见AOM-价格说明。 AOM与其他云服务组合使用,为您提供通知发送、日志转储、性能管理等功能,这些功
通过helm部署pod后,AOM无法查找到工作负载 问题描述 通过helm部署pod后,AOM无法查找到对应的工作负载。 原因分析 在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,
创建策略 功能说明 该接口用于创建策略。 策略名称必须为以0~9、a~z、A~Z、下划线(_)或中划线(-)组成的1~64位字符串,且必须以字母开头。 同一伸缩组下的策略,相同指标(metric_name)的metric_operation为“>”的metric_threshol