检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用监控 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。通过应用监控您可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 功能介绍 应用监控基于应用资源管理对资源实行从应用、业务组件、到环境的分层监控,每一层对应的观测指标均不同。 应用层监控
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
示)。TXT格式只能导出日志的内容(如图2所示),每行为一条日志。 图1 以CSV格式导出日志 图2 以TXT格式导出日志 (可选)单击“配置转储”,将搜索到的日志一次性转储到OBS桶的同一个.log日志文件中。具体操作详见添加一次性转储。 父主题: 日志管理(旧版)
通知给指定消息接收人。 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 您可以通过AOM的监控功能监控资源的使用情况,评估当前配置是否过高。例如:CPU、内存、带宽等资源的利用率。寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。
小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。 指标查询接口 单次最大可同时查询20个指标。 统计周期 最大统计周期为1小时。 单次查询返回指标数据 单个指标单次查询最大返回1440个数据点。 自定义指标
支持废弃。 ECS类型的Prometheus实例仅支持展示和配置UniAgent插件采集的指标。 CCE类型的Prometheus实例仅支持废弃如下指标: 只有在CCE “插件市场” 页面或AOM “集成中心” 页面安装的3.9.0以上的云原生监控插件(kube-promethe
小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。 指标查询接口 单次最大可同时查询20个指标。 统计周期 最大统计周期为1小时。 单次查询返回指标数据 单个指标单次查询最大返回1440个数据点。 自定义指标
群信息、安装状态和采集状态。 图1 查看集群接入信息 根据需要,选择需要接入的集群,单击该集群右侧的“一键安装”,为集群安装云原生监控插件。 图2 接入CCE集群 等待安装成功,单击“关闭”即可接入该CCE集群,并将集群关联到当前Prometheus实例。 单击“取消安装”,可取消对应CCE集群的接入。
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
服务的访问控制 身份认证 无论用户通过AOM控制台还是API访问AOM,都会要求访问请求方出示身份凭证,并进行身份合法性校验,同时提供登录保护和登录验证策略加固身份认证安全。AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。
身份认证与访问控制 身份认证 无论用户通过AOM控制台还是API访问AOM,都会要求访问请求方出示身份凭证,并进行身份合法性校验,同时提供登录保护和登录验证策略加固身份认证安全。AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。
群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4。 通过主机监控功能您可以及时了解主机的资源使用情况、趋势和告警信
进程监控”,在右侧区域选择“组件监控”页签,进入组件监控界面,查看组件列表。 组件列表中对组件名称、所属应用、部署方式、应用发现规则、使用率、操作等参数进行展示。 为了方便查看组件列表,可以在组件列表上方设置运行状态、所属应用、集群名称、部署方式、组件名称等过滤条件,实现组件列表过滤显示。 通过开启或关闭“隐藏系统
500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标 10个 100个 500个 查询指标数据API调用 50万次/月 100万次/月 500万次/月 事件和告警总条数 5万条/月,存储时长7天 10万条/月,存储时长30天 50万条/月,存储时长30天
功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 接入管理 接入管理功能支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。
系统(AOM支持的操作系统详见操作系统使用限制)且主机已安装ICAgent,即可将主机接入到AOM中进行监控。 ICAgent ICAgent是AOM的采集器,分别运行在每台主机上用于实时采集指标、日志和应用性能数据。安装ICAgent是使用AOM的前提,否则将无法正常使用AOM。
通过仪表盘监控Prometheus实例指标数据 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
基础指标免费,自定义指标收费,按照指标上报量进行计费。 CCI实例监控 按需计费 秒级监控指标数量 按需计费 自定义指标 按需计费 查询指标数据API调用 按需计费 免费 事件和告警总条数 按需计费 免费 指标存储量 7天内免费 15天内免费 数据转储量 免费 按需计费
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。