检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 AccessCode是调用API的身份凭据,每个项目最多可创建2个AccessCode,请您妥善保管。
关系型数据库,稳定高效,支持大量数据,广泛应用于网站和应用开发。具体操作请参见: MySQL日志接入(LTS) MySQL指标接入(AOM) Redis 内存数据结构存储系统,支持多种类型,用作数据库、缓存和消息代理。具体操作请参见: Redis日志接入(LTS) Redis 指标接入(AOM) Kafka 分
子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主机的操作系统,当前只支持选择Linux。 采集插件 默认NGINX。 插件版本 选择插件的版本。未上线的插件版本,则置灰,无法选择。 采集任务
Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主机的操作系统,当前只支持选择Linux。 采集插件 默认KAFKA。 插件版本 选择插件的版本。未上线的插件版本,则置灰,无法选择。 采集任务
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
放。 服务已接入需要的APM应用。 登录APM控制台接入一个APM应用时,系统会自动创建一个APM类型的Prometheus实例并显示在AOM控制台的“Prometheus监控 > 实例列表”界面。 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。
降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,无法及时从众多告警中及时发现故障,全面掌握应用情况。 解决方案 下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。
参考文档链接 弹性云服务器 主机监控分为基础监控、操作系统监控和进程监控。 基础监控 ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见云产品监控指标。BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控 通过在ECS或BMS中安装Agen
应用监控 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用
选择“桶列表”页签,单击“添加日志桶”,输入日志桶名称和描述,并添加目标日志文件,然后单击“确认”。 “组件”页签下显示除系统组件外的其他组件日志文件。 “系统”页签下显示所有的系统日志文件。 “主机”页签下显示所有的主机日志文件。 更多日志桶操作 日志桶添加完成后,您还可执行表1中的操作。
可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。 在CCE界面检查服务是否已被停止或删除。
功能总览 功能总览 全部 应用运维管理 接入中心 仪表盘 告警管理 日志管理 Prometheus监控 基础设施监控 应用性能&用户体验监控 云服务监控 设置 应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警
通常来源于组件性能图表或接口性能数据。 接口调用次数、请求平均时延、错误调用次数、请求吞吐量等 接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等
日志管理”。 单击页面右上角“返回旧版”,进入“日志搜索”页签。 单击“日志文件”页签。 查看日志文件 日志路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径。 登录AOM
快速分析日志流中的日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警
SASL_SSL参数 参数 说明 示例 用户名 SASL用户名用于实例访问认证。 demo 密码 SASL密码用于实例访问认证,请妥善管理密码,系统无法获取您设置的密码内容。 - 客户端证书 请采用.pem格式的客户端证书 - 单击“验证并保存自定义Kafka配置信息”,验证自定义Kafka实例连通性。
进行监控。 相关配置请参见查看组件基础监控项。 异常 异常监控项是对应用的异常日志进行监控。例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 相关配置请参见查看组件异常日志。 外部调用 外部调用是对当前应