-
仪表盘 - 应用运维管理 AOM
不同组件的CPU内核总量。 图1 曲线图 数字图:当需要实时监控某个指标的最新数值时,可使用此类型的图表。 如下图所示,可实时查看组件的上行bps的平均值。 图2 数字图 健康状态类图表(包括阈值状态、主机状态、组件状态图表) 支持阈值、主机、组件状态的展示。可将关注的一个或多个
-
概述 - 应用运维管理 AOM
到容器。通过各层状态,您可完成对组件的立体监控。 主机监控 通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 容器监控 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建应用。
-
接入中心总览 - 应用运维管理 AOM
志数据的监控能力,通过接入中心快速接入需要监控的指标和日志,接入完成后,即可方便地在“指标浏览”等页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的日志等信息。 前提条件 已将ELB日志接入LTS。 业务层接入 通过该功能可获取提取的ELB日志、事务监控或上报的自定义指标,例如用户数、订单数。
-
创建任务 - 应用运维管理 AOM
Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。 父主题: 自动化运维(aom2.0接口)
-
查询时序数据 - 应用运维管理 AOM
因指标格式统一,部分指标被重命名。本场景的CPU使用率metric_name入参值来自于调用查询时间序列接口(该接口metric_name入参需传入主机指标中查询到的重命名后的主机指标aom_node_cpu_usage),返回的metric_name参数值(重命名前的主机指标);集群ID和节点I
-
基础指标:CSE指标 - 应用运维管理 AOM
驱逐次数(即使未强制执行) 主机因连续返回5xx导致的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_detected_consecutive_gateway_failure 检测到的连续网关故障的驱逐次数 检测到的连续网关故障的驱逐次数(即使未强制执行)。
-
配置虚机日志采集路径 - 应用运维管理 AOM
会采集。 同一资源集下的所有ECS主机,无法同时使用AOM和LTS的日志采集功能,只能匹配系统中最新的日志采集配置。例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源集下,LTS中所有ECS主机的采集配置都失效。 配置虚机日志的采集路径时,不建议和容器服务日志映射
-
监控安全风险 - 应用运维管理 AOM
表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 应用监控 工作负载监控 集群监控 主机监控 指标浏览
-
查询Prometheus实例 - 应用运维管理 AOM
Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 OK 请求响应成功。 错误码 请参见错误码。 父主题: Prometheus实例
-
应用监控 - 应用运维管理 AOM
应用监控 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考应用发现。 应用监控
-
阈值告警最佳实践(新版) - 应用运维管理 AOM
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值
-
添加监控数据 - 应用运维管理 AOM
指标名称。长度1~255。 type 否 String 数据的类型。取值范围只能是"int"或"float"。 枚举值: int float unit 否 String 数据的单位。长度不超过32个字符。 value 是 Double 指标数据的值。取值范围有效的数值类型。 最小值:0 响应参数 状态码:
-
获取任务执行历史 - 应用运维管理 AOM
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 请求响应成功,返回指定任务的执行历史。 401 Unauthorized。在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。
-
查询指标 - 应用运维管理 AOM
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
-
上报事件告警信息 - 应用运维管理 AOM
InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 告警
-
配置管理 - 应用运维管理 AOM
配置管理 查询aom2.0相关云服务授权信息 查询主机安装的ICAgent信息 父主题: API
-
卸载ICAgent - 应用运维管理 AOM
卸载ICAgent 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致拓扑、调用链等功能不可用,请谨慎操作! 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 通过界面卸载 登录A
-
概述 - 应用运维管理 AOM
主要提供工作负载监控、集群监控、主机监控、进程监控和云服务监控的功能。 工作负载监控 工作负载监控的对象通过CCE部署的工作负载,通过工作负载监控可及时了解工作负载的资源使用、状态和告警等信息。 集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控展示集群的Pods运行状态、CPU使用率等信息。
-
什么是应用运维管理 - 应用运维管理 AOM
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
-
代理机 - 应用运维管理 AOM
选择已创建的代理区域。 qwsertyddfsdfdf 主机 选择已安装的UniAgent主机。 - 代理IP 配置代理机的IP地址 - 端口 端口号,必须小于或等于65535 - 单击“确认”,完成代理机添加。 修改代理IP 代理机创建完成后,可根据需要修改代理机的IP地址。具体操作如下: