检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在控制台查看不到日志怎么办? 如何处理界面“ICAgent状态”为“离线”的问题? 安装了ICAgent,但是监控不到主机是什么原因? 安装ICAgent过程中,系统提示“no crontab for root”是什么原因? AOM配置日志转储时无法选中obs桶是什么原因? Grafana无法展示内容是什么原因?
展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对应用的立体监控。在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考配置AOM应用发现规则。 通过AOM监控应用进程
上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据 通过AOM提供的OpenAPI接口或者Exp
ount 配置个数 ServiceComb配置个数。 ≥0 个 Nacos config nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。
查看操作日志 AOM会记录用户对UniAgent和其他插件执行安装、升级、卸载历史任务的操作日志。您可以查看相关任务的操作日志。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
查看操作日志 AOM会记录用户对UniAgent和其他插件执行安装、升级、卸载历史任务的操作日志。您可以查看相关任务的操作日志。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
响。 为了快速了解并进行中间件及自定义插件接入AOM服务,建议您按照如下步骤进行操作: 给虚机安装采集器底座UniAgent,用于安装Exporter,并创建采集任务。详情请参考:安装UniAgent。 创建ECS类型Prometheus实例,采集任务通过关联ECS Promet
当资源使用告警过多,告警通知过于频繁时,通过事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 告警通知 告警通知有2种方式: 直接告警:在配置告警规则的时候,可以配置告警通知规则,将告警信息通知相关人,以便提醒相关人员及时采取措施清除故障。告警方式包括邮件、短信、钉钉、企业微信、语音等方式。
仪表盘支持通过变量拼接填充图表标题。新增变量后,在仪表盘配置图表标题处使用“${变量名称}”进行拼接填充,即可基于该变量的过滤器下拉列表值,动态展示图表标题信息。 例如:仪表盘配置的原图表标题为“Dashboard”,新增的变量名称为“ClusterName”,即可以在仪表盘图表标题处配置“${ClusterName}
“集成中心”为CCE集群安装云原生监控插件,上报指标到指定的CCE类型Prometheus实例中。 当前仅CCE类型Prometheus实例支持。 接入中心 AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS
费用(除重复映射外)。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),AOM可以查询已配置采集路径的原始日志,但当前AOM的日志流无法在LTS控制台查看。您可以通过在AOM控制台添加接入规则来创建映射,映射创建后,即可通过LTS查看和分析AOM日志。
工程师为您开放此功能。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),AOM可以查询已配置采集路径的原始日志,但当前AOM的日志流无法在LTS控制台查看。您可以通过在AOM控制台添加接入规则来创建映射,映射创建后,即可通过LTS查看和分析AOM日志。
AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
规则的描述信息,最多可输入1024个字符。本示例可不填写。 - 设置告警规则的详细信息。 告警规则设置中的规则类型、配置方式、Prometheus 实例默认选择为指标浏览处的配置。 设置告警规则详情。指标与条件自动选择为指标浏览处配置,统计周期、检测规则等参数可按需设置。 如图3所示,“统计周期”设置为“1分钟”,“检测规则”设置为“平均值>0
开启分批发布后需填写每批发布的时间间隔。 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。 通过选择“主题”的方式配置审批人,您需要在消息通知服务中,创建一个新主题,并为这个主题添加订阅。
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 告警规则升级 登录AOM 1.0控制台。 在左侧导航栏中选择“告警 > 告警规则”。 选中一个或多