-
资源监控 - 应用运维管理 AOM
告警 告警是指AOM、ServiceStage、CCE、APM等服务在异常情况或在可能导致异常情况下上报的信息,告警会引起业务异常,您需要对告警进行处理。 事件 事件是指AOM、ServiceStage、CCE、APM等服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。
-
主机监控 - 应用运维管理 AOM
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
-
安装ICAgent - 应用运维管理 AOM
处理。 安装前提 在进行ICAgent安装前,需要先确保本地浏览器时间与服务器时区、时间都一致。若有多个服务器,则要保证本地浏览器、多个服务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 安装方式说明 ICAgent有两种安装方式,您可以
-
AOM有哪些使用限制? - 应用运维管理 AOM
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
-
约束与限制 - 应用运维管理 AOM
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
-
日志管理使用说明 - 应用运维管理 AOM
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
-
Prometheus实例 for Remote Write - 应用运维管理 AOM
所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,此处选择“Prometheus for Remote Write”。 设置完成,单击“确定”。 父主题: 创建Prometheus实例
-
启动ECS实例 - 应用运维管理 AOM
配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。 通过选择“主题”的方式配置审批人
-
获取Prometheus实例的服务地址 - 应用运维管理 AOM
获取Prometheus实例的服务地址 在default、ECS、CCE、Remote Write类型的Prometheus实例的“设置”页签下“服务地址”区域,可以获取当前Prometheus实例的Remote Read和Remote Write Prometheus配置代码。在云服务、多账号聚合
-
将Prometheus的数据上报到AOM - 应用运维管理 AOM
bearer_token: '{access_code}' 参数说明: region_name为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同,您可以从地区和终端节点中获取。例如AOM服务在“华北-北京一”区域名称为“cn-north-1”。 Site domain name suffix
-
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? - 应用运维管理 AOM
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。
-
基本概念 - 应用运维管理 AOM
并进行处理。 拓扑 拓扑是对服务间调用关系和依赖关系的可视化展示(拓扑图)。拓扑图主要是由圆圈、箭头连线和资源组成。每个圆圈代表一个服务,圆圈上每个分区代表一个实例。每个圆圈中的分数表示活跃的实例/总实例数。分数下的内容分别表示在当前所选的时间内服务被调用次数、响应时延、错误数。
-
安装文件包提示没有OBS权限怎么办? - 应用运维管理 AOM
自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。请在“设置 > 访问凭证”页面检查是否已创建访问凭证,如果没有创建访问凭证,请参考访问凭证新建凭证; 如果已创建访问凭证依然提示没有OBS权限,请参考如何对OBS进行访问权限控制,添加OBS访问权限。 父主题: 运维管理(日落)
-
应用运维管理 AOM - 应用运维管理 AOM
第一次使用AOM,您需要先开通AOM,并安装ICAgent。ICAgent是AOM的采集器,用于实时采集指标、日志和应用性能数据。 快速入门 使用流程 安装ICAgent 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。 最佳实践 阈值告警最佳实践 服务发现最佳实践 统计日志关键词 06 API 您可以
-
修订记录 - 应用运维管理 AOM
2020-07-30 AOM2.0版本上线。 Console 切换UI4.0。 2019-11-30 支持云服务监控功能:展示华为云各服务实例的历史性能数据曲线,了解云服务实例运行状况。 2019-11-13 日志采集规则修改:指定日志采集文件名时不受日志文件扩展名(.log、.trace和
-
通过告警降噪清除告警风暴 - 应用运维管理 AOM
取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。 此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。 取值范围:0min-15day,推荐设置为1h。 步骤二:创建全量指标告警规则
-
建设完整指标体系,实现立体化监控 - 应用运维管理 AOM
在弹出的“云服务接入”对话框中选择需要监控的云服务。例如RDS或DCS服务。 单击“确定”完成接入。 接入完成后,系统自动跳转至“云服务监控”页面,即可查看已选择的云服务运行状态等信息。 接入完成后,在左侧导航栏选择“指标浏览”。在右侧区域通过选择指标的方式查看接入的基础设施层指标。
-
创建事件告警规则 - 应用运维管理 AOM
创建事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
-
创建事件类告警规则 - 应用运维管理 AOM
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
-
创建指标告警规则 - 应用运维管理 AOM
量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。 检测规则设置为“最大值>0.2”。 触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监