检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控PostgreSQL运行状态。本文介绍如何
配置虚机日志采集路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 前提条件 您需先为您的虚机安装ICAgent,详见安
定时任务无法成功触发 问题描述 系统无法触发定时任务(按确定时间或周期定时触发脚本执行、文件管理、服务场景以及作业管理等操作)。 可能原因 账号欠费、冻结或受限,会导致定时任务无法正常触发。 解决方法 账号欠费:客户欠费后,为防止相关资源不被停止或者释放,需要客户及时进行充值,详细说明请参见:欠费还款。
使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控PostgreSQL运行状态。本文介绍如何
日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM 2.0告警规则相关功能。 日志升级
日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM 2.0告警规则相关功能。 日志升级
传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 注意事项 如需使用“应用资源管理
选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表4。 配置服务场景任务。 任务类型选择“服务场景”。 在服务场景的下拉列表中,选择服务场景。不同服务场景的具体操作,参见服务场景。 图6 配置服务场景 配置作业管理任务。 任务类型选择“作业管理”。 在下拉列表中,分别选择作业名和执行方案。
快速分析日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。 解决方案 AOM通过设置告警规则,实时监控环境中主机、组件等资源使用情况。当产品自身或外部服务存在异常情况时,立即触发告警。并提供告警降噪功能
内(通常为弹性云服务器ECS集群)的应用组件进行监控场景,可以通过接入中心添加Prometheus中间件监控。 Prometheus实例 for 云服务 多种云服务 提供多种云服务的监控。 说明: 一个企业项目下只支持创建一个“Prometheus for 云服务”类型的Prometheus实例。
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,并展现在AOM界面中供用户搜索和查看,详细介绍请参见日志管理使用说明。 父主题:
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,并展现在AOM界面中供用户搜索和查看,详细介绍请参见日志分析。 父主题: 安全
选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。 添加白名单权限。 单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。
项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 策略名称 描述 类别 依赖系统权限 AOM FullAccess AOM管理员权限,拥有该权限的用户可以操作并使用AOM。 系统策略 CCE Administrator、OBS Administrator、LTS
仪表盘(新版)功能当前仅在华东-上海一区域受限开放,如有需求可以通过提交工单申请开放此功能。 注意事项 系统预置的仪表盘模板都保存在“系统内置”分组下,包含容器、云服务、原生中间件、应用。预置仪表盘不允许删除或调整分组,仪表盘模板不支持创建。 系统预置的容器类型仪表盘需要在CCE集群下的“插件管理”中安装“kube
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
x86_64服务器,采集管理支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本。 表5 UniAgent支持的Windows操作系统及版本 操作系统
OS账号 管理不同类型的系统账号,用于执行脚本和文件管理。单用户支持最多创建100个账号。 创建账号 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > OS账号”,进入账号管理页面。 单击右上角的“创建账号”,弹出创建账号页面。
组件增加一个便于识别的别名。 单击“操作”列下的“增加别名”进行增加。 添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件,AOM默认为系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gp