检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了
称”文本框中设置的阈值规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。 图1 选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条
误率突增的原因。 图4 TopN接口错误率突增 应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。
ebug中的日志文件。 一个虚机最多可配置20条日志采集路径。 同一资源空间下的所有ECS主机,无法同时使用AOM和LTS的日志采集功能,只能匹配系统中最新的日志采集配置。例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源空间下,LTS中所有ECS主机的采集配置都失效。
数据订阅 AOM支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 数据订阅功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 最多可创建10个数据订阅规则。 创建订阅规则 在左侧导航栏中选择“配置管理
以将维度理解为这些特征的类别。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统,且主机已安装
CCE的控制台,在左侧导航栏中选择“权限管理”,单击页面右上角的“添加权限”,单独进行权限设置。 单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。 单击工作负载名称,可查看该工作负载的详细信息。 在“Pod实例”页签
请输入用户侧Prometheus实例的Remote Write地址,作为指标发送的目标地址。 传输请求的协议,请根据实际情况从下拉列表中选择,推荐使用HTTPS协议。 数据类型 默认为“指标”。 Prometheus实例 从下拉列表中选择需要转发指标的Prometheus实例。下拉列表中显示当前账号下的所有通用实例类型Prometheus实例。
显示列”前的复选框,自定义可选列的展示与隐藏。 编辑指标接入规则 单击“操作”列的“编辑”,可以修改指标接入规则,详细操作请参见接入中心总览。 删除指标接入规则 删除一个指标接入规则:单击“操作”列的“删除”。 删除一个或多个指标接入规则:选中一个或多个指标接入规则前的复选框,单击列表上的“删除”按钮。
性能问题 具体的性能问题的描述。 调用方法 当前问题出现的方法名。 问题出现数 在查询的时间范围内,当前性能问题出现的次数。 CPU使用率 当前问题最后一次出现,所使用的资源(cpu)的使用率。 操作 支持的其他操作类型,目前仅支持查看详情。 单击操作列的“查看详情”,展示某
code的key”、“业务code的正确值”参数后,会采集相应的应用码。一般情况下,应用码的值与业务code的正确值相同。配置url监控项详见:配置url监控项。 选填 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签
search_time_start 否 Long 时间范围查询的开始时间。 最小值:0 最大值:9999999999999 search_time_end 否 Long 时间范围查询的结束时间。 最小值:0 最大值:9999999999999 status 否 String 任务的状态 ["success","fail"
应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。
后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 远程卸载:此操作适用于正常安装ICAgent后需远程卸载的场景。 批量卸载:此操作适用于正常安装ICAgent后需批量卸载的场景。 服务器上的ICAgent被卸载后,会影响该服务器的运维能力
择待监控的资源,单击“下一步”。 资源树上最多可选择100个资源。 当选择多个资源时,创建操作完成后,会创建多个单条阈值规则,每个资源对应一个单条阈值规则。规则命名方式为:您在“阈值名称”文本框中设置的阈值规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。
通过日志接入和日志搜索功能帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 支持 支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持
单击主机列表右上角的按钮,可对已接入的虚机展示列进行设置。 过滤主机信息 在主机列表的表头,单击各列的,可按特定类型过滤显示主机的信息。 切换主机排序 在主机列表的表头,单击“UniAgent心跳时间”列的可切换主机的排序。为默认排序,为按时间正序排序(即最新的UniAgent心跳时间显示在最后方),为按时间
使用Prometheus监控ECS主机的指标 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、可靠的云上环境。应用运维管理(Application
事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形成动态上界,以比对近10分钟的数据是否有异常。支持如下事件类型:
从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可单击“新建分组规则”添加,具体操作请参见分组规则。 图3 设置告警降噪方式 单击“立即创建”,完成创建。创建了一条阈值规则,单击其前的,可对其下的多个资源的同一指标批量监控。 在展开的列表中,只要某个主机的指标数据满足设