检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源接入AOM 安装ICAgent(华为云主机) 安装ICAgent(非华为云主机) ICAgent版本说明 配置应用发现规则 配置日志采集路径
命令中包含mkfs.ext3 /dev/xdxxx,块设备会被格式化,直接让你的系统达到不可恢复的阶段 umount command \\s*umount\\s+.* umount -v /dev/sda1 可能影响系统或服务的正常运行 poweroff command \\s*poweroff\\s*
务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。当资源的日志数据满足设置的告警条件,产生日志告警。
Agent包下载配置 表1 Agent包下载配置 区域 Agent包下载地址 SHA-256 华北-北京一 https://icagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/ICAgent_linux/ICProbeAgent
AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 该功能当前仅在华北-乌兰察布二零一、华南-广州、华北-北京四区域开放。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、
配置CCE集群指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例
AOM 2.0控制台入口 LTS控制台入口 参考文档链接 配额设置 当日志超过每月免费赠送的额度(500M)时,超过的部分将按需收费。如果每月免费赠送的额度已经可以满足您的使用需求,超过后希望暂停日志收集,可以在配置中心进行设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。
运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个 iotda_device_status_offlineCount 离线设备数 统计租户在当前实例/资源空间下的离线的设备数量 ≥0 个 iotda_device_status_abnormalCount
oaded JobManager自JVM启动以来加载的类的总数。 无 flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded JobManager自JVM启动以来卸载的类的总数。 无 flink_taskmanager_St
根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。
中间件采集任务:使用中间件插件创建的采集任务。 自定义采集任务:使用自定义插件创建的采集任务。 AOM可观测监控Prometheus版提供快捷安装配置各类型中间件插件及自定义插件的功能,并提供开箱即用的专属监控大盘。 中间件:您可以直接使用内置的中间件插件来创建采集任务,目前支持的中间件插件有以下
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
告警管理使用说明 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装UniAgent,详情请参考“安装UniAgent”,安装之后使用流程请参见图1。
等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
单击“拓扑”,切换至拓扑页签,页面展示所选实例的调用趋势图。 您还可以根据需要执行以下操作: 单击“只显示组件之间调用”后的按钮,仅展示组件之间的调用。 单击“全部展开”按钮,展示所选实例一段时间的全部调用关系。 单击“重新布局”按钮,改变调用趋势图的布局。 单击刷新时间选择按钮,选择刷新方式和自动刷新的时间,默认“手动刷新”。当前支持“1分钟
填写规则的描述信息。 图1 设置告警基本信息 设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。
心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示: 会产生自定义指标上报的场景:接入Prometheus后,为什么会产生额外费用?。 指标存储时长
通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 设置