检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以下方法解决: 异常:表示主机安装的UniAgent功能异常,请联系技术支持。 安装中:表示该主机正在安装UniAgent。安装UniAgent预计需要1分钟左右,请耐心等待。 安装失败:表示主机安装UniAgent失败,请重新安装。 未安装:表示主机未安装UniAgent。安装
异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管
中划线,以字母开头。 主机 单击“添加主机”,在“添加主机”页面中选择用于配置采集任务和安装Exporter的主机: 可通过主机名称、IP地址和Agent状态搜索选择主机。 可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及
(RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy
删除工作负载 workload deleteWorkload 更新工作负载 workload updateWorkload 上报ECS主机信息 ecs aomImportECS 资源监控 创建仪表盘 dashboard updateDashboard 删除仪表盘 dashboard deleteDashboard
资源管理界面有资源则展示该资源,无资源则不展示。 应用管理界面涉及到绑定环境的资源都会展示。 表1 资源列表 资源类型 子类型 信息 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、应用环境、UniAgent状态、资源状态、操作。 云容器引擎CCE - 工作负载 负载名
单击。 图1 添加环境 在“添加环境”页面中,设置环境类型、主机类型等信息。 表1 添加环境 参数名称 说明 环境类型 环境的类型。目前支持环境类型有四种:开发、测试、预发布和生产。 主机类型 主机的类型。目前支持的主机类型有:LINUX和WINDOWS。 环境名称 环境的名称。
在主机组列表中选择待接入采集配置的主机组。 如果当前没有可选的主机组,可以单击“新建主机组”去创建一个主机组。 您还可以根据需要对主机组执行编辑、删除等相关操作,详情请参见管理主机组。 配置接入规则时以主机组为单位下发采集配置,方便您对多台主机数据进行采集。当用户扩容主机时,只需在主机组中添加主机,该主机
ometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。 创建Prometheus 通用实例
Write方式读取或上报Prometheus数据、支持对接Grafana。 基础设施监控:支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。 日志管理:提供全场景日志采集
(RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM已在统一身份认证服务IAM为您创建名为“ aom_admin_trust
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
中划线,以字母开头。 主机 单击“添加主机”,在“添加主机”页面中选择用于配置采集任务和安装Exporter的主机: 可通过主机名称、IP地址和Agent状态搜索选择主机。 可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。
集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制 主机状态包含“正常”、“异常”、“亚健康”、“通道静默”、“已删除”。当由于网络异常、主机下电、关机等原因导致的主机异常,或主机产生阈值告警时,主机状态为“异常”。 如果需要在AOM控制台中使用CCE的功能,需提前
Flink 运行环境接入 弹性云服务器ECS 日志/指标 运行环境接入AOM 裸金属服务器BMS 云容器引擎CCE 云容器实例CCI 自建K8S集群 云服务接入 应用运维管理(AOM)、API网关(APIG)、Astro轻应用(Astro Zero)、裸金属服务器(BMS)、云堡垒机(
用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址
点、下划线开头或以小数点结尾。 所属日志组:在下拉框中选择已创建日志组。 所属日志流:在下拉框中选择已创建日志流。 主机组配置:将所选组件环境中主机添加到LTS主机组。 单击“选择环境”。 选择需要采集日志文件环境所属的“应用”、“区域”。 直接搜索或展开应用树选择需要的环境。 单击“确定”。
集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。 磁盘指标 clusterId 集群ID。 diskDevice 磁盘名称。 hostID 主机ID。 nameSpace