检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
输入搜索条件,在实例列表中通过搜索条件来选取实例,默认按照名称搜索。 过滤条件 输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条件,搜索时多个过滤属性之间为“与”的关系。 该方式对未来新增的实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。
表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 配额设置 当日志超过每月免费赠送的额度(500M)时,超过的部分将按需收费。如果每月免费赠送的额度已经可以满足您的使用需求,超过后希望暂停日志收集,可以在配置中心进行设置。 登录AOM 2
12.100 上报内存指标增加内存workingset使用量、内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS日志黑名单功能,更改容器指标来源为working_set
AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。 资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。 使用限制:单节点上运行容器个数小于1000个。 保护机制: 采集器ICAgent对CPU资源的消耗最大不超过2核。
应用发现 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
配置应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
如果跳板机ECS掉电重启,请重新执行如上命令。 获取AK/SK,请参考获取AK/SK。 生成ICAgent安装命令,并复制该命令。 在文本框中输入DC和跳板机连接IP,生成ICAgent安装命令。 DC:自定义节点所属数据中心名称,便于分类查看主机。 跳板机连接IP:使用EIP方式连接,为跳
如果跳板机ECS掉电重启,请重新执行如上命令。 获取AK/SK,请参考获取AK/SK。 生成ICAgent安装命令,并复制该命令。 在文本框中输入DC和跳板机连接IP,生成ICAgent安装命令。 DC:自定义节点所属数据中心名称,便于分类查看主机。 跳板机连接IP:使用EIP方式连接,为跳
错误次数 消息处理错误次数 最慢调用(ms) 最大响应时间 创建连接数 创建连接数 关闭连接数 关闭连接数 关闭原因 连接关闭的原因 流量(M) 流量 0-10ms 响应时间在0-10ms范围请求数 10-100ms 响应时间在10-100ms范围请求数 100-500ms 响应时间在100-500ms范围请求数
代理机 代理机是您在华为云购买和配置的一台华为云ECS弹性云服务器,可以解决多云之间网络互通问题。 添加代理机 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中,选择“采集设置 > 代理区域管理”,进入代理区域管理页面。 单击“添加代理机”,配置相关参数信息。
采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 告警规则 告警规则 告警规则(包含指标告警规则和事件告警规则)最多可创建3000个。 告警模板
环境类型 环境的类型。目前支持环境类型有四种:开发、测试、预发布和生产。 主机类型 主机的类型。目前支持的主机类型有:LINUX和WINDOWS。 环境名称 环境的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 区域 环境的区域,请从下拉列表中选择。
安装UniAgent(新版) 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。
P,不同服务不同区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京一”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。 监控接口、日志接口和弹性伸缩接口请使用AOM的终端节点,APM接口请使用APM的终端节点,详见终端节点。
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。
下面的操作以按全量指标创建为例,通过选择指标和设置条件,配置指标告警规则。 在左侧导航栏选择“告警管理 > 告警规则”,单击“创建”。 设置告警规则基本信息,具体的参数说明如表3所示。 表3 基本信息填写说明 参数名称 说明 示例 规则名称 规则名称。最多可输入256个字符,只能包含中文、字母、数字、下划线和中划线,开头、结尾不允许输入特殊字符。
选择调用链的HttpMethod。 选填 状态码 调用链返回的HTTP状态码。多个状态码以逗号“,”分割。 选填 响应时间 调用链的响应时间范围,可以填写最小响应时间和最大响应时间搜索调用链,两个值都可以为空。单位ms。 选填 是否异常 调用链是否有异常。 选填 Trace ID 调用链的TraceID。填
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 约束与限制 如需使用“日志流”功能,需提前在“菜单开关”中开启日志流的开关,详细操作请参见菜单开关。 使用日志分析(新版)功能的区域没有日志流功能。
行状况。 AOM有哪些优势 图3 AOM优势1 图4 AOM优势2 海量日志管理 高性能搜索和业务分析,自动将关联的日志聚类,可按应用、主机、文件名称、实例等维度快速过滤。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。