检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开通自动化运维 开通自动化运维时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需分别进行开通操作。 用户首次登录开通自动化运维,需要添加Security Administrator角色,后续使用自动化运维服务则不需要此角色权限。 自动化运维功能
通过ECS验证到AOM域名的连通性。 登录弹性云服务器 ECS控制台。 在左侧导航栏中选择“弹性云服务器 > 弹性云服务器”。 单击弹性云服务器名称,进入弹性云服务器的“基本信息”页签。 检查弹性云服务器中的“虚拟私有云”与步骤一购买终端节点时选择的虚拟私有云是否一致。 若一致,则继续后续操作。
、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、
配置Grafana数据源参数。 URL:将URL设置为3.c获取的HTTP URL信息。 User:将User设置为3.c获取的用户名信息。 Password:将Password设置为3.c获取的密码信息。 Auth下Basic auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置
中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理 > 通用配置)”中字节码方式采集被停止。 如果长时间未采集到指标数据,可能的原因有: java9启动提示找不到sql
型。 采集日志文件的资源消耗 日志文件采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。 日志丢失 采集器使用多种机制保证日志采集的可靠性,尽可能保证数据不丢失,但在如下场景可能导致日志丢失。 日志文件未使用CCE提供的logPolicy轮转策略。
e_megabytes) 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) 可用虚拟内存(aom_node_virtual_memory_free_megabytes) 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(MB) 显存容量(aom
如果您通过登录AOM华为云官网直接进入AOM 1.0服务页面,可在弹出的“通知”对话框中单击“前往授权”,前往AOM2.0授权。 AOM 1.0套餐包不能再购买,新的计费方式在AOM 2.0授权之后生效。如果不前往AOM2.0授权开通AOM,AOM 1.0只有部分功能可用。 在弹出的“通知”对话框中仔细阅读从AOM 1
本章以通过告警行动规则名称获取告警行动规则为例。 涉及的基本信息 通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。 获取指定告警行动规则的详细信息 接口相关信息 URI格式:GET
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默、屏蔽需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则、创建静默规则和创建告警屏蔽规则。 约束与限制 此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。
a/b/c,a、b、c各代表一层。 选填 用户应用 用户所属的应用名称。 必填 监控JAVA应用(为部署在CCE容器中的JAVA应用安装Agent) AOM提供应用接入功能,可以为部署在CCE容器中的JAVA应用安装APM探针Agent,来监控JAVA应用,以提供更精准的问题分析与定位,协助您高效解决应用难题。
0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“接入管理”功能。 如果需要在AOM控制台中使用LTS的功能,需要提前获取LTS的相关权限,详情请参见LTS权限管理。 表1 功能说明 功能名称 功能说明 AOM
online_exist_status Boolean 脚本中是否有已上线的版本,true表示有已上线的版本,false表示没有已上线的版本 online_id String 已上线版本id 最小长度:1 最大长度:64 project_id String 租户从IAM申请到的projectid,一般为32位字符串
project_id String 租户从IAM申请到的projectid,一般为32位字符串 最小长度:32 最大长度:32 job_reference_number Integer 脚本版本的引用次数,脚本版本被作业引用的次数。默认是0次,引用次数为非负整数,不能出现负数 最小值:0
容器过去10秒内的CPU负载的平均值 container_cpu_usage_seconds_total 容器在所有CPU内核上的累积占用时间 container_file_descriptors 容器打开的文件描述符数量 container_fs_inodes_free 文件系统的可用inode数量
alarm period. 无效的限制、指标或者告警周期 请检查对应的参数是否符合要求。 400 SVCSTG_AMS_4000106 Invalid offset, time range, or email. 无效的偏移量、时间范围或者电子邮件 请检查对应的参数是否符合要求。 400
登录管理控制台的账号。 ${domain_name} 通知类型 创建通知规则时选择的类型:告警或事件 ${event_type} 事件级别 创建通知规则时选择告警或事件级别:紧急、重要、次要、提示 ${event_severity} 事件名称 触发通知规则的告警或事件的名称 $event
Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。