检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
usage) 该指标用于统计测量对象的NPU使用率。 0~100 百分比(%) NPU温度(aom_node_npu_temperature_centigrade) 该指标用于统计NPU的温度。 - 摄氏度(℃) 物理内存使用率(aom_node_memory_usage) 该指
按需计费是一种先使用再付费的计费模式,适用于无需任何预付款或长期承诺的用户。本文介绍按需计费AOM的计费规则。 适用场景 按需计费适用于具有不能中断的短期、突增或不可预测的应用或服务,例如电商抢购、临时测试、科学计算。 适用计费项 按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。 表1 计费项说明
维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。
仅支持CCE类型主机的NPU指标采集。 0~100 百分比(%) aom_node_npu_temperature_centigrade NPU温度 该指标用于统计NPU的温度。 说明: 仅支持CCE类型主机的NPU指标采集。 - 摄氏度(℃) aom_node_memory_usage 物理内存使用率
企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 您可以通过AOM的监控功能监控资源
深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。
500 智能小站 aom_node_npu_temperature_centigrade node_temperature 节点温度 Atlas 500小站节点温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) node_power node_power 节点功率 Atlas
他库。 PromQL Prometheus监控的查询语言。支持瞬时查询和时间跨度查询,内置多种函数和操作符。可以对原始数据进行聚合、切片、预测和联合。 Sample 一条时间线在某个时间点对应的数值。在Prometheus监控服务中,每个Sample由一个float64数据类型的值和一个毫秒精度的时间戳构成。
DCGM_FI_DEV_GPU_TEMP GPU温度 表示GPU温度。 >0 摄氏度(℃) DCGM_FI_DEV_POWER_USAGE GPU功率 表示功率。 >0 瓦(W) DCGM_FI_DEV_MEMORY_TEMP 内存温度 表示内存温度。 >0 摄氏度(℃) DCGM_FI_
控制。 2018-9-5 云应用立体运维,提供资源、应用、应用体验的全链路、多层次、一站式运维平台。 智能运维,提供智能阈值机制,基于机器学习动态阈值告警,提升监控效率。 端侧分析,支持移动APP和Browser性能指标分析和崩溃分析等,实现应用全端掌控。 事务洞察,支持自动发现事务性能问题,智能筛选,完成根因探究。
元、万、亿 货币 人民币 (¥)、美元 ($)、欧元 (€)、英镑 (£)、卢布 (₽) 速度 m/s、km/h、m/h、knot、ft/s 温度 C、K、F、R 吞吐量 ops、reqps、readps、wps、opm、readpm、wpm 时间间隔 ns、μs、ms、s、min、h、d、week、month、year
在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进程状况、应用性能(错误数、请求数、平均响应时间)、告警分
云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。
云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。
rest_client_requests_total REST请求数量 workqueue_adds_total 工作队列Add次数 workqueue_depth 工作队列深度 workqueue_queue_duration_seconds_bucket 任务在工作队列中存在的时长 aggregator_una