检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态
进行监控。 相关配置请参见查看组件基础监控项。 异常 异常监控项是对应用的异常日志进行监控。例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 相关配置请参见查看组件异常日志。 外部调用 外部调用是对当前应
和可扩展性场景。具体操作请参见:配置Prometheus 通用实例接入(AOM)。 KAFKA协议 高吞吐、分布式、基于TCP的二进制消息系统协议。具体操作请参见:使用KAFKA协议上报日志 (LTS)。 Open Telemetry 使用开源OpenTelemetry协议上报应
进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。 图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。 AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。 优势 体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
扩展名(.log、.trace和.out)限制;被采集日志文件必须为文本文件。 2019-8-30 容器指标增加对“文件系统可用”“文件系统容量”和“文件系统使用率”的支持。 主机和容器指标增加对NPU指标的支持。 2019-8-21 支持统计分析APP的用户运营数据,便于您更有针对性地开展运营活动。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
ent会自动安装。 AOM和LTS使用的ICAgent功能完全相同,ICAgent采集的指标数据均上报到AOM分析处理,日志数据则只能匹配系统中最新的日志采集配置。 例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源集下,LTS中所有ECS主机的采集配置都失效。 ICAgent状态说明详见下表。
ICAgent属于插件,UniAgent不属于插件,二者不是同一个含义。 UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent
卸载ICAgent 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致拓扑、调用链等功能不可用,请谨慎操作! 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 通过界面卸载 登录
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警
要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key和value只能包含中文、字母、数字和下划线。
在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。 支持分别搜索“组件”、“系统”、“主机”日志。 组件日志支持设置“集群”、“命名空间”、“组件”等过滤条件,还可以通过“高级搜索”,设置“实例”、“主机”、“文件名称”、“隐藏系统组件”等过滤条件搜索日志。 系统日志支持设置“集群”、“主机”等过滤条件。
为您开放此功能。 Alpine Linux系统不支持Profiler功能。因为Alpine Linux是一个轻量级的Linux系统发行版,缺少运行Profiler的必要依赖。如果需要支持Profiler功能,建议使用标准Linux操作系统。 为了应用运行稳定,强烈建议您按照要求升
当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。 设置告警通知策略时,不推荐使用告警降噪并关联分组规则,累计触发相当于告警降噪。
主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 入口为:“进程监控 > 应用监控” 主要监控通过应用发现规则发现的进程对应的应用。 父主题: 应用监控
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警
ECS云服务器 选择安装模式 安装模式当前仅支持命令行安装。 控制台会提供安装命令,您需要远程登录机器执行安装命令。 命令行安装 云服务器操作系统 操作系统当前仅支持Linux。 Linux UniAgent版本 选择待安装的UniAgent版本,默认最新版本。 最新版本 复制并执行安装命令