检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
前应用的仪表盘,以图表的形式展示指标源、日志源以及系统图表信息。 组件监控 在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标
} 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 OK 请求响应成功。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。
服务场景会按照查看场景分类展现对应的已上架的工具卡片,可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作。如果不需要对卡片做下架操作,请参考自动化运维自定义策略,拒绝卡片下架操作。具体操作如表1。 表1 相关操作 操作 说明 收藏卡片 单击待收藏卡片上的。 下架卡片 单击卡片右上角的并选择“下架”。
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了
非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产价值的最大化。通过云审计服务,您可以记录与AOM服务相关的操作事件,便于日后的查询、审计和回溯。 开通云审计服务
_total 传输时丢弃的累积计数 node_network_transmit_errs_total 传输时遇到的错误累积计数 node_network_up 网卡的状态 node_network_transmit_packets_total 传输数据包的累积计数 node_ne
OM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),AOM可以查询已配置采集路径的原始日志,但当前AOM的日志流
OM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 约束与限制 AOM日志接入LTS功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 什么是映射 AOM中的日志实际上是以一个日志流的形式在
AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
Prometheus实例的名称,进入实例的详情页面。 在左侧导航栏中单击“仪表盘”,即可查看当前Prometheus实例下系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控主机的磁盘分区信息,则单击“di
oaded JobManager自JVM启动以来加载的类的总数。 无 flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded JobManager自JVM启动以来卸载的类的总数。 无 flink_taskmanager_St
容器过去10秒内的CPU负载的平均值 container_cpu_usage_seconds_total 容器在所有CPU内核上的累积占用时间 container_file_descriptors 容器打开的文件描述符数量 container_fs_inodes_free 文件系统的可用inode数量
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。 其他组合模式。
用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现IT对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产调优。
a/b/c,a、b、c各代表一层。 选填 用户应用 用户所属的应用名称。 必填 监控JAVA应用(为部署在CCE容器中的JAVA应用安装Agent) AOM提供应用接入功能,可以为部署在CCE容器中的JAVA应用安装APM探针Agent,来监控JAVA应用,以提供更精准的问题分析与定位,协助您高效解决应用难题。
采集时间偏移量”、“事件等级”来过滤采集您所需要的日志内容。 日志格式:选择采集的日志文件是单行显示还是多行显示。 日志时间:当日志格式选择“单行日志”时,需要选择每条日志的行首显示的是日志的采集时间(选择“系统时间”),还是日志的打印时间(选择“时间通配符”)。 日志采集时间:
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
接入中心”,进入新版接入中心页面。当前部分区域的菜单路径修改为“接入中心 > 接入中心”。 如果您进入的是旧版接入中心,需要单击“接入中心”页面右上角“体验新版”进入新版接入中心页面。 勾选“类型”下的“运行环境”前的复选框,筛选出运行环境卡片。 单击卡片上的“接入指标(AOM)”或“接入日志
应用资源管理使用限制 限制项 说明 应用数量 租户创建的应用个数最多不超过1000。 子应用数量 应用下创建的子应用数量最多不超过50。 组件数量 子应用下的创建的组件数量最多不超过50。 环境数量 组件下可创建的环境数量最多不超过20。 资源数量 单个环境管理的同类实例资源数量最多不超过2000。