检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能:
作: 单击监控条件后的,可将对应行的指标数据在当前图表中隐藏。 单击监控条件后的,可将对应行的指标数据和监控条件转换为Prometheus命令。 单击监控条件后的,可快速复制对应行的指标数据及监控条件等信息,并根据需要修改。 单击监控条件后的,可删除对应行指标数据的监控。 通过“
“mkdir /opt/cloud/”命令创建/opt/cloud目录,再执行“mkdir lts”创建lts目录。 继续执行“chmod 750 lts”命令,修改lts目录权限。 在lts目录下执行“touch custom_tag”命令,创建custom_tag文件。 继续执行“chmod
创建修改ECS非管理员密码任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“修改ECS非管理员密码”卡片,或单击卡片右上角的选择“创建任务”,进入创建修改ECS非管理员密码任务页面。 填写基本信息,具体的参数说明请参见表1。
步骤二(可选):检查VPC内的ECS安全组配置 通过ECS验证到AOM域名的连通性。 登录弹性云服务器 ECS控制台。 在左侧导航栏中选择“弹性云服务器 > 弹性云服务器”。 单击弹性云服务器名称,进入弹性云服务器的“基本信息”页签。 检查弹性云服务器中的“虚拟私有云”与步骤一购买终端节点时选择的虚拟私有云是否一致。
write()打印输出。 使用print(message.flush=True)打印输出。 填写完成后,单击“校验高危命令”。校验高危命令为正则校验,校验不通过可能会导致风险。高危命令的详细说明请参见表1。 执行策略 分批发布 选择是否开启分批发布开关,默认不打开。 每批发布 开启分批发布后需填写每批发布数量。
选择“卸载”。 在弹出的对话框中,单击“确认”,可卸载主机的UniAgent。 您还可以以root用户登录需卸载UniAgent的服务器,执行如下命令手动卸载UniAgent。 bash /usr/local/uniagentd/bin/uninstall_uniagent.sh;
通过CCE模板填充:不确定指标信息或对普罗格式不了解时,可采用系统自动填充方式。在下拉列表中选择“CCEFromProm”,单击“请选择默认模板”,从默认提供的CCE模板中选择合适的模板,系统会根据选择的模板自动填充相关指标的普罗格式命令行。 单击可参考示例输入命令,命令行输入的详细说明请参见普罗语句说明。
设置事件类型及对应事件来源。 事件类型设置为“系统事件”,此时事件来源只能选择“CCE”和“ModelArts”服务。 事件类型设置为“自定义事件”,事件来源请从现有的服务列表中选择。 设置告警规则详情。 图1 设置告警规则详情 表2 告警规则填写说明 参数名称 填写说明 监控对象 服务事件的筛选条件。从通
如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 子服务名称 策略名称 描述 类别 依赖系统权限 应用资源管理/监控中心/采集管理 AOM FullAccess AOM2.0管理员权限,拥有该权限的用户可以操作并使用AOM。 系统策略 CCE FullAccess、DMS
邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM可以支持设置阈值告警的指标类型如下。 类型 指标举例 组件(进程) CPU内核总量、CPU内核占用、CPU使用率等 主机网络 接收Bps、接收错包率、发送错包率、总Bps。 主机磁盘、文件系统 磁盘读取速率、磁盘写入速率、磁盘使用率。
业务监控(BETA) 创建日志指标规则 创建日志指标规则(新版)
Profiler性能分析,仅针对白名单用户开放。 Alpine Linux系统不支持Profiler功能。因为Alpine Linux是一个轻量级的Linux系统发行版,缺少运行Profiler的必要依赖。如果需要支持Profiler功能,建议使用标准Linux操作系统。 为了应用运行稳定,强烈建议您按照要求升
UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 UniA
AOM产品结构图 托管&运行态 AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基
创建告警规则(按全量指标创建) 03:45 创建告警规则(按全量指标创建) 应用运维管理 AOM 创建告警规则(按Prometheus命令创建) 04:08 创建告警规则(按Prometheus命令创建) 应用运维管理 AOM 通过虚机接入方式接入中间件指标 03:54 通过虚机接入方式接入中间件指标
例如一个商城应用包含用户管理服务、登录验证服务、商品列表、订单管理服务等。 子应用 应用管理的可选节点,同一个应用下,最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。 组件 构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DM
将不同图表展示到同一个屏幕上,通过多种图表形式展示资源的指标、日志和性能数据。 部分支持 只支持指标数据和系统性能数据的可视化监控,不支持日志数据的监控。 支持 告警管理 对服务设置事件条件或者对资源的指标设置阈值条件,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,将告警信息以邮件、短信、企业微信等方式发送给指定的人员。
安装ICAgent过程中,系统提示“no crontab for root”是什么原因? 问题描述 安装ICAgent过程中,系统提示“no crontab for root”。 图1 安装ICAgent 可能原因 安装ICAgent的脚本会同时安装crontab计划任务,该提示信息表示当前没有root的计划任务。
URI-scheme:表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点中获取。例如AOM服务在“华北-北京一”区域的Endpoint为“aom.cn-north-1.myhuaweicloud