检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置AOM告警通知 创建AOM告警消息模板 创建CES通知对象和通知组 创建AOM告警行动规则(告警通知规则) 父主题: 告警监控
ICAgent管理(非华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。更多关于日志采集路径的说明请参见:配置日志采集路径。 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”,在“配置中心 > 采集开关”页签,将“日志采集开关”置于“开启”状态。
前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 配置自建Prometheus数据上报到AOM 安装并启动开源版Prometheus,具体操作请参见Prometheus官方文档。(如果已经部署并正在使用开源
如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
务场景。 图6 配置服务场景 配置作业管理任务。 任务类型选择“作业管理”。 在下拉列表中,分别选择作业名和执行方案。 图7 配置作业管理 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表5。 表5 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择
是否需要安装ICAgent插件: true:安装ICAgent插件。默认安装最新版本的ICAgent插件。 false:不安装ICAgent插件。 plugin_install_base_param 否 PluginInstallBasicParam object 插件安装基础信息:
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 创建CES告警屏蔽规则 父主题: 告警监控
ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat
建议将隐私或敏感数据上传到AOM,必要时请加密保护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AK/SK,有效保护敏感信息。 容器监控
如果没有创建过OBS桶,请单击“查看OBS”跳转到OBS界面进行创建。 首次配置一次性转储到未授权的OBS桶中时,AOM服务会授权给OBS桶ACL规则,授权生效需要15分钟,如果您第一次配置一次性转储后失败,请15分钟后重试。 不支持转储到存储类型为归档存储或配置了跨区域复制的OBS桶。 obs-store-test
触发指标告警。 高级设置 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 XX小时:间隔XX小时检查一次查询和分析结果。 XX分钟:间隔XX分钟检查一次查询和分析结果。 XX秒:间隔XX秒检查一次查询和分析结果。 检查频率可以设置为15秒或30秒以实现秒级监控。指标告
建议将隐私或敏感数据上传到AOM,必要时请加密保护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AKSK,有效保护敏感信息。 容器监控
ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择“告警
已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 已创建通知组,操作详见创建CES通知对象和通知组。 约束与限制 您最多可创建1000个告警行动规则(告警通知规则),如果告警行动规则(告警通知规
每小时:每小时检查一次查询和分析结果。 每天:在每天的某个固定时间点检查一次查询和分析结果。 每周:在周几的某个固定时间点检查一次查询和分析结果。 固定间隔:按照固定间隔检查查询和分析结果。 CRON:通过Cron表达式指定时间间隔,按照指定的时间间隔检查查询和分析结果。 Cron表
配置AOM菜单开关 AOM支持用户自定义选择在控制台导航栏中显示或隐藏“概览”、“应用洞察”、“自动化运维”、“云服务监控”、“业务监控”等功能。 配置AOM菜单开关 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“菜单开关”,所有
为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
容器监控:在云容器引擎 CCE购买集群和节点后,自动安装ICAgent插件,将CCE集群指标上报到AOM,用户无需手动接入。 配置告警行动规则:通过创建告警行动规则关联SMN主题与消息模板,当CCE的指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 配置告警:通过创建告警