检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置容器服务日志采集路径 AOM支持容器服务日志采集,并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 注意事项 ICAgent只采集*.log、*.trace和*.out类型的文本日志文件。 配置步骤 在CCE中添加日志策略 在CCE
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker
概述 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行
TURBO,SMN,VPN,GeminiDB,AS,CloudTable,MRS,CBH,ER,GaussDB for MySQL,DCS,RDS,OBS,DMS,ELB,NAT,VPC,GaussDB DWS,LakeFormation,WAF,DRS,DDS,DC,CSS,EVS,CBR,APIG)以及
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
概述 AOM日志接入LTS功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志
日志接入LTS概述 AOM日志接入LTS功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS
为云服务新增告警规则 云服务名称 告警规则类型 新增方式 FunctionGraph、DRS、RDS、NAT、VPC、DCS、CSS、DC、CBR、DMS、ELB、EVS、OBS、DDS、WAF 指标告警规则 单击“新增阈值告警规则”。 在弹出的“创建规则”对话框中设置规则名称、指标数据和告警条件等
监控JAVA应用和Node.js应用 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件JAVA应用和Node.js应用的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。 监控JAVA应用:AOM支持通过快速接入Agent来监控JAVA应用,以及
仪表盘监控 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例 for
日志接入 可以将应用资源管理中主机待采集日志的路径配置到日志流中,ICAgent将按照日志采集规则采集日志,并将多条日志进行打包,以日志流为单位发往AOM,您可以在AOM控制台实时查看日志。 前提条件 已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
云服务、开源监控系统、Prometheus API/SDK接入和Prometheus 自定义插件接入的指标。 日志数据 请参见添加日志图表 监控业务指标或其他日志指标,如基于ELB日志清洗出来的接口黄金指标(时延、吞吐和错误)。 添加指标图表。参考表3设置相关参数,设置完成后单击“保存”。 图1 添加指标图表 表3 添加指标图表
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
概述 应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障
约束与限制 应用资源管理使用限制 表1 应用资源管理使用限制 对象 使用限制 应用 租户创建的应用个数<=1000。 子应用 应用下创建的子应用数量<=50。 组件 子应用下的创建的组件数量<=50。 环境 组件下可创建的环境数量<=20。 资源 单个环境管理的同类实例资源数量<=2000。
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
创建任务 功能介绍 该接口用于创建工作流(任务),返回工作流详情。任务类型取决于模板名称和'input'参数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/cms/workflow 表1 路径参数 参数 是否必选 参数类型 描述 project_id