检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大,这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。 node_load5 节点5分钟CPU负载
20 DC4(设备控制4) 52 4 84 T 116 t 21 NAK(确认失败回应) 53 5 85 U 117 u 22 SYN(同步用暂停) 54 6 86 V 118 v 23 ETB(区块传输结束) 55 7 87 W 119 w 24 CAN(取消) 56 8 88 X
配置虚机日志采集路径 √ x 查看桶日志 √ √ 添加日志转储 √ x 修改日志转储 √ x 删除日志转储 √ x 开启周期性转储 √ x 暂停周期性转储 √ x 创建统计规则 √ x 修改统计规则 √ x 删除统计规则 √ x 配置分词 √ x 安装ICAgent √ √ 升级ICAgent
在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进程状况、应用性能(错误数、请求数、平均响应时间)、告警分
≥0 千字节/秒(kB/s) GPU显存 ma_container_gpu_mem_total_megabytes 显存容量 该指标用于统计训练任务的显存容量。 >0 兆字节(MB) ma_container_gpu_mem_util 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。
上报APM(调用链、JVM)指标使用 30200: ICAgent的控制端口 30201: ICAgent的控制端口 如果界面上点击升级操作失败,该怎么办? 自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。 ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。
任务id,待修改任务的id。 最小长度:1 最大长度:64 表2 Query参数 参数 是否必选 参数类型 描述 action 是 String 启动或暂停任务的定时执行。enable为开启定时任务,disable为关闭定时任务 最小长度:1 最大长度:10 枚举值: enable disable
云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。
云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。
rest_client_requests_total REST请求数量 workqueue_adds_total 工作队列Add次数 workqueue_depth 工作队列深度 workqueue_queue_duration_seconds_bucket 任务在工作队列中存在的时长 aggregator_una