-
应用场景 - 应用运维管理 AOM
行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了
-
应用监控 - 应用运维管理 AOM
应用监控基于应用资源管理对资源实行从应用、业务组件、到环境的分层监控,每一层对应的观测指标均不同。 应用层监控 在应用层,主要监控业务层 、应用层、中间件层以及基础设施层告警信息,同时通过绑定当前应用的仪表盘,以图表的形式展示指标源、日志源以及系统图表信息。 组件监控 在组件层,主要监控组件的告警信息。支持从组件层
-
产品架构 - 应用运维管理 AOM
AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。
-
自动化运维 - 应用运维管理 AOM
将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标准化运维发布成服务,用户无需感知底层操作逻辑,仅输入简单的信息即可自助完成特定运维场景。 参数库 在作业、标准化运维中定义的全局共享参数,支持字符串,主机列表类型。除了达
-
基础指标:IoTDA指标 - 应用运维管理 AOM
取值范围 单位 设备总数 iotda_device_status_onlineCount 在线设备数 统计租户在当前实例/资源空间下的在线的设备数量 ≥0 个 iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个
-
配置分词 - 应用运维管理 AOM
DLE(跳出数据通讯) 48 0 80 P 112 p 17 DC1(设备控制1) 49 1 81 Q 113 q 18 DC2(设备控制2) 50 2 82 R 114 r 19 DC3(设备控制3) 51 3 83 S 115 s 20 DC4(设备控制4) 52 4 84 T 116 t 21 NAK(确认失败回应)
-
磁盘分区指标 - 应用运维管理 AOM
'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device Mapper ”,表示驱动类型为Device Mapper ,则支持查看磁盘分区thinpool指标。如果执行结果不为“Device Mapper”,则不支持查看磁盘分区thinpool指标。 表1 磁盘分区指标
-
高危命令说明 - 应用运维管理 AOM
ext3\\s+/dev/[a-z]d[a-z]+\\s* mkfs.ext3 /dev/sda 命令中包含mkfs.ext3 /dev/xdxxx,块设备会被格式化,直接让你的系统达到不可恢复的阶段 umount command \\s*umount\\s+.* umount -v /dev/sda1
-
基础指标:Modelarts指标 - 应用运维管理 AOM
DCGM_FI_PROF_DRAM_ACTIVE Memory BW Utilization 表示在一个时间间隔内,向设备内存发送数据或者从设备内存接收数据的时间占比。 该值表示一个时间间隔内的平均值,而不是瞬时值。 较高的值表示设备内存的利用率较高。 该值为1(100%)表示在整个时间间隔内每个周期执行一次DRAM指令(实际上,约0
-
产品功能 - 应用运维管理 AOM
应用监控是针对资源和应用的监控,通过应用监控您可以及时了解应用的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->组件详情->实例详情->进程详情。即在应用监控中,将应用、组件、实例、进程做了层层关联,在界面上就可以直接得知各层关系。
-
主机监控 - 应用运维管理 AOM
将无法监控)。同时,主机的IP地址支持IPv4、IPv6。 通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 注意事项 一个主机最多可添加5个标签,且标签键不能重复。 不同主机可添加同一个标签。
-
添加节点 - 应用运维管理 AOM
支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 子应用的描述信息,最多可输入255个字符。 同一个应用下,最多可创建3层子应用。 同一个应用下,最多可创建50个子应用。 同一个应用下,最多可创建50个组件。 设置完成后,单击“确认”。 更多操作 节点创建完成后,您可以在应用树中执行表2中的操作。
-
主机监控 - 应用运维管理 AOM
卡片区域,可查看该主机的运行状态、ID等信息。 单击任一页签,在列表中可监控运行在主机上实例的资源占用、健康状态信息和显卡、网卡等常用系统设备信息。 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。
-
建设完整指标体系,实现立体化监控 - 应用运维管理 AOM
监控的业务层、应用层、中间件层、基础设施层指标,在仪表盘中实现个性化监控,以及通过统一告警入口配置告警规则,实现业务的日常巡检,保障业务的正常运行。 AOM提供多场景、多层次、多维度指标数据的监控能力,建立了从基础设施层指标、中间件层指标、应用层指标到业务层指标的四层指标体系,将
-
批量废弃指标 - 应用运维管理 AOM
租户从IAM申请到的projectid,一般为32位字符串。 prom_instance_id String Prometheus实例id。 请求示例 废弃指标iotda_device_status_inactiveCount。 https://{end_point}/v2/{project_id}/aom/{pro
-
资源管理 - 应用运维管理 AOM
单击资源实例名称/ID,在该资源实例详情页面,可查看详细信息。在资源详情页面单击“更多”,可跳转至该服务Console界面查看更多信息。 用户购买该服务资源后,CMDB可实时感知获取该资源信息,并展示在资源管理页面。 资源类型相关信息,详见表1。 表1 资源类型 资源类型 子类型 信息 操作 云服务器ECS - -
-
什么是应用运维管理 - 应用运维管理 AOM
d Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。
-
基础指标:容器指标 - 应用运维管理 AOM
gpu模式分成0、1、2三种:0为显存隔离算力共享模式;1为显存算力隔离模式;2为默认模式表示当前卡还没被用于xgpu设备分配。 xgpu_device_health xgpu设备的健康情况。0表示xgpu设备为健康状态,1表示为非健康状态。 serviceMonitor/monitoring/prometheus-server/0
-
接入中心总览 - 应用运维管理 AOM
点。 应用层接入 通过该功能可接入组件性能图表或接口性能指标,例如请求平均时延、错误调用次数、请求吞吐量。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 在右侧“应用层”面板单击需要接入的指标卡片。 单击“Java”卡片,在“接入应用”界面接入相关应用层指标,具体操作请参见监控JAVA应用。
-
与其他服务的关系 - 应用运维管理 AOM
云日志服务 云日志服务(Log Tank Service,简称LTS)可以提供日志收集、分析、存储等服务。用户可以通过云日志服务快速高效地进行设备运维管理、用户业务趋势分析、安全监控审计等操作。 AOM作为华为云可观测性分析统一入口,自身并不具有日志服务功能,所有的日志服务及相关功能均集成自LTS。