检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序 在任务列表的表头,单击各列的,可切换任务的排序,为正序排序,为倒序排序。 父主题: 管理采集插件平台UniAgent
个矩形块表示的时间为已选择的时间范围/30,例如,时间范围选择近30分钟,则每个矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。 图1 通过柱状图查看统计数据 将鼠标移至矩形块,提示信息显示了该矩形块代表的时间范围(起
SQL分析语句,AOM会根据设置的语句对日志流中的日志进行监控。 校验规则 输入具体的条件表达式,当条件表达式返回为true的时候,产生告警,否则不产生告警。 触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 您可以使用本文档提供的API对应用运维管理服
停止计费 对于以按需计费模式使用的AOM 2.0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。
可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 配置AOM告警规则
PAAS_APP_NAME:应用名称,即要部署的工作负载名称。 PAAS_NAMESPACE:命名空间名称,即要部署的工作负载所在CCE集群的的命名空间。可进入CCE集的详情页的“命名空间”页面进行查询。 PAAS_PROJECT_ID:租户的项目ID。获取方法详情请参见:获取项目ID。 以上env相关参数的value请根据实际情况替换。
容器监控 容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
产品规格差异 应用运维管理服务(简称AOM)按计费方式不同分为基础版、按需版两种,其中按需版又分为专业版和企业版。 各版本的具体规格差异请参见表1。 表1 版本规格差异说明 规格项 基础版 专业版 企业版 日志读写流量 500MB 400GB 1TB 日志索引流量 500MB 400GB
odMonitor的方式暴露采集目标。 预聚合 Prometheus监控的Recording Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 时间序列 由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 远程存储 自研的时序数据存储组件。
在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 也可在右侧的搜索框中,输入“资源名称”,可搜索资源分组。 编辑资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 在资源分组名称后的操作列,单击“修改”。 在弹出的窗口,修改资源信息后,单击“确定”,修改资源信息。
终止任务执行 功能介绍 该接口可终止正在执行的任务,指定工作流ID和执行ID去终止对应的任务,返回终止操作状态。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/cms/workflow/{workflow_id}/executions/{e
持指标查看、新增和废弃功能。 在指标管理页面仅支持查询近3个小时内上报的指标。 default类型的Prometheus实例下,指标名以“aom_”、“apm_”开头以及资源类型为ICAgent的指标暂不支持废弃。 ECS类型的Prometheus实例仅支持展示和配置UniAgent插件采集的指标。
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM
Prometheus实例的名称,进入实例的详情页面。 在左侧导航栏中单击“仪表盘”,即可查看当前Prometheus实例下系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控主机的磁盘分区信息,则单击“di
单击“对象分析”,进入对象分析页面。 图1 对象分析 输入类名,选择实例后,单击“确认”,展示该实例中当前字段的实时取值。包括:类型、字段名以及详情。 单击详情列的“查看详情”,页面右侧区域展示该字段的详细信息。 父主题: 通过Debugging诊断代码
UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中、安装失败和未安装,若UniAgent为非“运行中”状态,请分别按照以下方法解决: 异常:表示主机安装的UniAgent功能异常,请联系技术支持。 安装中:表示该主机正