华为云用户手册

  • 约束限制 仅支持处于“运行中”或“关机”状态的弹性云服务器执行此操作。 仅支持单网卡切换虚拟私有云。 切换虚拟私有云前如果重装/切换过云服务器的操作系统,请先登录云服务器,验证重装/切换时设置的密码或密钥是否注入成功。 如果成功登录云服务器,说明密码或密钥注入完成,可继续执行其他操作。 否则说明系统正在注入密码或密钥信息,在此期间请勿对云服务器执行其他操作。 切换虚拟私有云过程中,请勿执行绑定、解绑或更换弹性公网IP等操作,若执行会提示权限不足,无需处理。 如果网卡上有IPv6地址,无法切换虚拟私有云。
  • 修订记录 发布日期 修订记录 2024-06-20 数据保护技术补充Spark作业和Flink作业开通加密通信配置说明。 2024-03-30 新增产品规格。 2024-03-04 权限管理,补充增强型跨源连接权限与系统权限的说明。 2023-09-18 约束与限制补充增强型跨源连接测试连通性时对IP和 域名 的约束限制。 2023-09-05 将产品介绍中 DLI 计费说明移动至计费说明。 2023-08-02 权限管理,补充DLI系统权限依赖关系。 2023-07-03 约束与限制,补充DLI相关功能约束限制说明。 2023-03-13 “计费说明”新增弹性资源池CU时的计费说明。 2023-01-05 权限管理,修改只读权限的说明。 权限管理,新增弹性资源池常用操作与系统权限关系说明。 调整产品介绍手册结构。 2022-11-11 新增安全,包含DLI安全特性相关内容。 2022-08-08 优化“计费说明”。
  • Maven构建默认命令含义是什么? 构建服务内置的默认构建命令为 # 功能: 打包 # 参数说明: # -Dmaven.test.skip=true:跳过单元测试 # -U:每次构建检查依赖更新,可避免缓存中快照版本依赖不更新问题,但会牺牲部分性能 # -e -X :打印调试信息,定位疑难构建问题时建议使用此参数构建 # -B:以batch模式运行,可避免日志打印时出现ArrayIndexOutOfBoundsException异常 # 使用场景: 打包项目且不需要执行单元测试时使用 mvn package -Dmaven.test.skip=true -U -e -X -B 其中,各命令/参数含义为: mvn package:使用maven执行打包动作,此命令会在项目target目录下生成软件包,可根据需要自行调整目录。 -Dmaven.test.skip=true:跳过单元测试,建议保留。 -U:每次构建检查依赖更新,可避免缓存中快照版本依赖不更新问题,但会牺牲部分性能,建议保留。 -e -X:打印调试信息,定位疑难构建问题时建议使用此参数构建。 -B:以batch模式运行,可避免日志打印时出现ArrayIndexOutOfBoundsException异常
  • 项目说明 本文演示项目涉及两个Maven工程、一个基础Docker镜像及一个Dockerfile。 WebServer项目:此次构建主项目,期望使用CodeArts Build构建此项目,并使用得到的构建包制作Docker镜像,制作镜像所用Dockerfile存放于此项目根目录。 WebUtil项目:WebServer依赖的自研工具包,在WebServer项目pom文件中引入,主要用于演示私有依赖库使用场景。 基础镜像:以此镜像为基础,在基础镜像中添加WebServer构建包制作Docker镜像。 Dockerfile:用来制作镜像。 项目构建过程如下: 本文详细描述了从准备代码仓库到构建并制作镜像、推送镜像到SWR仓库的完整过程。大致分为以下步骤,可根据熟悉程度选择阅读: 构建准备 发布私有依赖到私有依赖库 打包并制作、推送镜像 查看构建结果 父主题: 使用Maven构建 自定义镜像 (预置执行机,图形化构建)
  • 修订记录 发布日期 修订记录 2024-06-20 第四次正式发布。 修改如下章节: 包年/包月 开发中心/运维中心/运行时引擎/运营中心计费项 2024-04-16 第三次正式发布。 修改如下章节: 包年/包月 按需计费 开发中心/运维中心/运行时引擎/运营中心计费项 AI原生应用引擎计费项 2024-02-08 第二次正式发布。 新增如下章节: 按需计费 AI原生应用引擎计费项 修改如下章节: 计费模式概述 包年/包月 开发中心/运维中心/运行时引擎/运营中心计费项 续费 欠费说明 停止计费 2023-11-25 第一次正式发布。
  • 如果发票丢失了,怎么办? 如果是增值税普通发票,客户可以提交工单申请,注明账号名、发票抬头、发票金额、发票代码、发票号码、遗失原因等信息。华为云工作人员审核后,由华为云向客户提供加盖发票章的发票底联复印件或扫描件。 如果是增值税专用发票,客户需要邮寄加盖公章的《发票遗失声明》《发票遗失声明》到华为云。收到声明后,华为云向客户提供增值税专用发票记账联复印件(加盖发票章)。华为云接收《发票遗失声明》的收件地址: 当签约主体为“华为软件技术有限公司”时,退票材料寄送地址:江苏省南京市雨花台区软件大道101号华为南京基地;收件人:周媛媛;电话:025- 56623909。 当签约主体为“ 华为云计算 技术有限公司”时,退票材料寄送地址:贵州省安顺市平坝区马场镇数谷大道华为云上屯B5-3楼;收件人:何智丽;电话:15186998007。 父主题: 开具发票
  • 客户自己是否可以切换与伙伴的关联模式? 客户可以通过以下两种方式切换与伙伴的关联模式: 客户联系合作伙伴,由合作伙伴在伙伴中心发起切换关联类型的申请,客户在账号中心确认该申请后即可更换关联类型。具体操作请参见管理客户关联关系。 客户首先在账号中心申请与合作伙伴解除关联,再重新以另一种关联模式申请关联合作伙伴。为避免频繁切换合作伙伴关联关系,客户在3个月内仅可以提交一次解除关联的申请。 父主题: 经销商子客户
  • 调用BSS接口状态码返回400 BadRequest 一般出现这种情况有两种可能: 合作伙伴调用接口时传入的请求参数有误。此时可以查看响应消息,一般会说明是哪个请求参数有误,请查看调用时是否遵循《API参考》中该请求参数的定义。 传入的请求消息不是JSON格式。请检查请求消息头参数中是否添加了“Content-Type":"application/json”字段,并确保传入的请求消息是JSON格式。若全是非必填参数,需传入"{}"。 父主题: 接口调用
  • 请求消息 请求参数如表 请求参数所示。 表2 请求参数 参数 是否必选 参数类型 描述 subnet_id 否 String 子网ID ,UUID格式。更新IPv4地址时,必须指定该参数;更新IPv6地址时,该参数可以不填。 ip_address 否 String IPv4地址,为空字符串时表示随机更新网卡IPv4地址。 约束: 该参数和ipv6_address必须指定一个。 该参数和ipv6_address不能同时指定。 ipv6_address 否 String IPv6地址,为空字符串时表示随机更新网卡IPv6地址。 约束: 该参数和ip_address必须指定一个。 该参数和ip_address不能同时指定。
  • 请求示例 更新云服务器网卡,并指定IPv4地址。 POST https://{endpoint}/v1/{project_id}/cloudservers/{server_id}/os-interface/{port_id}/change-network-interface { "subnet_id": "7bf939cc-167f-49d5-a933-9cca504210ab", "ip_address":"192.168.1.159" } 更新云服务器网卡,随机分配IPv4地址。 POST https://{endpoint}/v1/{project_id}/cloudservers/{server_id}/os-interface/{port_id}/change-network-interface { "subnet_id": "7bf939cc-167f-49d5-a933-9cca504210ab", "ip_address":"" } 更新云服务器网卡,并指定IPv6地址。 POST https://{endpoint}/v1/{project_id}/cloudservers/{server_id}/os-interface/{port_id}/change-network-interface { "subnet_id": "7bf939cc-167f-49d5-a933-9cca504210ab", "ipv6_address":"2001:db8:a583:578:2840:2d9f:27d4:2713" } 更新云服务器网卡,随机分配IPv6地址。 POST https://{endpoint}/v1/{project_id}/cloudservers/{server_id}/os-interface/{port_id}/change-network-interface { "subnet_id": "7bf939cc-167f-49d5-a933-9cca504210ab", "ipv6_address":"" }
  • URI POST /v1/{project_id}/cloudservers/{server_id}/os-interface/{port_id}/change-network-interface 参数说明请参见表 参数说明。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 server_id 是 云服务器ID。 port_id 是 网卡ID。
  • 接口约束 关机状态的弹性云服务器才允许更新指定网卡属性。 当前只允许更新弹性云服务器主网卡属性。 只开通了IPv4协议的网卡,不支持修改网卡的IPv6地址。 只开通了IPv4协议的网卡,不支持跨VPC修改网卡的IPv4地址。 已开通IPv6协议的网卡,不支持跨子网修改网卡的IPv4地址和IPv6地址。 已开通IPv6协议的网卡,网卡上已绑定共享带宽或虚拟IP,不允许修改网卡的IPv4地址和IPv6地址。
  • 响应示例 { "id": "6bcb3ac6-c5f7-45a8-b6df-aadc6839c2d9", "subnet_id": "7bf939cc-167f-49d5-a933-9cca504210ab", "ip_address": "192.168.1.159", "ipv6_address": "2001:db8:a583:578:192:168:1:159" }
  • 使用须知 竞享计费型实例目前支持通用计算增强型实例规格。 华为云尽可能保障竞享实例正常运行,但在系统资源不足等极端情况下会主动释放实例,请务必做好数据备份工作。 竞享计费型实例目前只支持部分区域及规格,请以购买页面显示的资源为准 竞享计费型实例保障周期不同价格不同。 竞享计费型实例不支持转换为按需和包年/包月实例。 竞享计费型实例不支持变更实例规格。 竞享计费型实例不支持变更操作系统。 竞享计费型实例不支持自动恢复功能。 竞享计费型实例不支持卸载系统盘。 竞享计费型实例在中断回收时: 不允许使用竞享实例制作系统盘镜像和整机镜像,但允许使用该云服务器的数据盘制作数据盘镜像。 不允许删除。 竞享计费型实例在中断回收时,数据盘和弹性公网IP默认不释放。请设置通知提醒,来决定是否释放关联的数据盘和弹性公网IP。具体方法,请参见“购买竞享计费型实例”。
  • 计费规则 请认真阅读竞享计费型实例的计费规则,详情请参见“竞价计费(竞享模式)”。 计费价格:竞享实例根据购买时长实行分段收费,购买时长小于6小时与等于6小时情况下价格不一致,您可以参考价格详情。价格计算器上的金额如果遇小数点,则保留小数点后两位,第三位四舍五入。如遇四舍五入后不足¥0.01 元,则按¥0.01 元展示。 计费周期:实例创建成功后开始计费,精确到秒级计费,按用户使用时长计费,实例释放后出所有整点账单。且使用期间进行关机等操作,仍然计费。 关联服务:竞享实例模式仅适用于vCPU和内存价格,不适用于OS、系统盘、数据盘、网络带宽的价格。OS、系统盘、数据盘、网络带宽、IP按各自计费规则计费(与按需保持一致)。系统盘与实例一起创建,一起释放,但数据盘系统不会删除,需要用户自行删除。 代金券:除现金券、储值卡适用之外,其他折扣券、代金券等均不适用。
  • 计费样例 竞享实例精确到秒级计费,购买界面显示小时单价,将小时单价除以3600即可得到每秒的价格。 样例1:以C6.large.2规格为例,用户购买时长3小时,08:58:30开通实例 使用3小时后正常到期,11:58:30终止实例,终止实例后出整点话单 表1 话单样例1 账单周期 周期内使用时长(秒) 计费(元) 08:58:30-09:00:00 90 90/3600*0.07 09:00:00-10:00:00 3600 0.07 10:00:00-11:00:00 3600 0.07 11:00:00-11:58:30 3510 3510/3600*0.07 用户主动提前释放实例,10:28:30终止实例,终止实例后出整点话单 表2 话单样例2 账单周期 周期内使用时长(秒) 计费(元) 08:58:30-09:00:00 90 90/3600*0.07 09:00:00-10:00:00 3600 0.07 10:00:00-10:28:30 1710 1710/3600*0.07 系统提前释放实例,10:28:30终止实例,终止实例后出整点话单(免除) 表3 话单样例3 账单周期 周期内使用时长(秒) 计费(元) 08:58:30-09:00:00 90 0 09:00:00-10:00:00 3600 0 10:00:00-10:28:30 1710 0 样例2:以C6.large.2规格为例,用户购买时长6小时,08:58:30开通实例 使用6小时后正常到期,14:58:30终止实例,终止实例后出整点话单 表4 话单样例4 账单周期 周期内使用时长(秒) 计费(元) 08:58:30-09:00:00 90 90/3600*0.12 09:00:00-10:00:00 3600 0.12 10:00:00-11:00:00 3600 0.12 11:00:00-12:00:00 3600 0.12 12:00:00-13:00:00 3600 0.12 13:00:00-14:00:00 3600 0.12 14:00:00-14:58:30 3510 3510/3600*0.12 用户主动提前释放实例,13:28:30终止实例,终止实例后出整点话单 表5 话单样例5 账单周期 周期内使用时长(秒) 计费(元) 08:58:30-09:00:00 90 90/3600*0.12 09:00:00-10:00:00 3600 0.12 10:00:00-11:00:00 3600 0.12 11:00:00-12:00:00 3600 0.12 12:00:00-13:00:00 3600 0.12 13:00:00-13:28:30 1710 1710/3600*0.12 系统提前释放实例,13:28:30终止实例,终止实例后出整点话单(免除) 表6 话单样例6 账单周期 周期内使用时长(秒) 计费(元) 08:58:30-09:00:00 90 0 09:00:00-10:00:00 3600 0 10:00:00-11:00:00 3600 0 11:00:00-12:00:00 3600 0 12:00:00-13:00:00 3600 0 13:00:00-13:28:30 1710 0
  • 工作原理 购买竞享实例时,需要选择保障周期(1-6小时),保障周期不同价格不同。保障周期是购买竞享实例的最小单位时间。在保障周期内由云平台中断竞享实例,当前周期不计费。在保障周期内用户删除竞享实例,当前周期按使用时长计费。 竞享实例购买成功后,当达到用户购买时长或库存资源不足时,实例将会进入“中断回收中”状态,随后释放。用户可以根据业务需要随时主动释放实例,实例释放后按用户实际使用时长收费。 华为云会尽可能保障竞享实例正常运行,但在极端情况下会中断释放该类实例,实例被中断时会秒级释放,请在使用竞享实例时做好备份策略。 在保障周期内由云平台中断竞享实例,当前周期不计费。在保障周期内用户主动释放实例,当前周期按使用时长计费。 一般情况下,竞享实例回收会优先选择使用时长较短的实例中断回收,尽可能降低对用户的业务损伤,但仍然建议您优化应用设计,保证在竞享实例被中断回收的情况下业务也可以正常工作。您可以尝试主动释放竞享实例,检测在竞享实例被中断回收的情况下应用工作是否正常。 图1 竞享实例的生命周期 在保障周期内由云平台中断竞享实例,当前周期不计费。在保障周期内用户主动释放实例,当前周期按使用时长计费。
  • 什么是竞享计费型实例? 竞享实例是竞价计费的一种新型售卖模式,其最核心的特点是超低价格和系统抢占机制,即您可以以较低折扣购买实例,但同时在系统资源不足等极端情况下系统可能会自动回收这些实例。其适用于各种无状态、容错或者灵活的应用场景。 采用竞享模式购买的弹性云服务器,称之为“竞享计费型实例”,简称“竞享实例”。 竞享实例目前支持华为云通用计算增强型,目前已经上线C6机型的多个规格,C6s、C3机型会陆续上线。 在该计费模式下,您可以以折扣价购买并使用弹性云服务器,性能与常规云服务器无异。但是当库存资源不足,系统会自动释放您的云服务器资源,对这些折扣售卖的弹性云服务器进行中断回收。与“按需计费”和“包年/包月”方式购买的弹性云服务器相比,在提供同等性能的前提下,竞享实例可提供超低折扣,降低用云成本。
  • 操作系统监控指标:DAVP 表12 DAVP类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) davp_device_health DAVP健康状态 该指标用于统计虚拟机上DAVP卡的健康状态,是一个综合指标。 该指标无单位。 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 0:代表健康 1:代表异常 云服务器 云服务器 - DAVP 1分钟 davp_util_rate_mem DAVP显存使用率 该指标用于统计该DAVP卡的显存使用率。 单位:百分比 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 0-100% 云服务器 云服务器 - DAVP 1分钟 davp_usage_mem DAVP显存使用量 该指标用于统计该DAVP卡的显存使用量 单位:MB 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 ≥ 0 云服务器 云服务器 - DAVP 1分钟 davp_util_rate_ai_core DAVP卡AI核心使用率 该指标用于统计该DAVP卡的AI核心的使用率。 单位:百分比。 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 0-100% 云服务器 云服务器 - DAVP 1分钟 davp_util_rate_vdsp_core DAVP卡vdsp核心使用率 该指标用于统计该DAVP卡的vdsp核心使用率。 单位:百分比。 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 0-100% 云服务器 云服务器 - DAVP 1分钟 davp_util_rate_enc_core DAVP卡编码核心使用率 该指标用于统计该DAVP的编码核心使用率。 单位:百分比。 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 0-100% 云服务器 云服务器 - DAVP 1分钟 davp_util_rate_dec_core DAVP卡解码核心使用率 该指标用于统计该DAVP卡的解码核心使用率。 单位:百分比。 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 0-100% 云服务器 云服务器 - DAVP 1分钟 davp_sysc_temperature DAVP卡系统模块温度 该指标用于统计该DAVP卡的系统模块温度。 单位:摄氏度(℃)。 采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。 ≥ 0 云服务器 云服务器 - DAVP 1分钟 Windows系统暂不支持DAVP类监控指标。
  • 维度 维度 Key Value 云服务器 instance_id 云服务器ID。 云服务器 - 磁盘 disk 云服务器磁盘。 该取值可通过 云监控服务 的“查询主机监控维度指标信息”获取。 云服务器 - 挂载点 mount_point 云服务器磁盘的挂载点。 该取值可通过 云监控 服务的“查询主机监控维度指标信息”获取。 云服务器 - GPU gpu GPU类型云服务器中显卡。 该取值可通过云监控服务的“查询主机监控维度指标信息”获取。 云服务器 - NPU npu NPU类型云服务器中显卡。 该取值可通过云监控服务的“查询主机监控维度指标信息”获取。 云服务器 - DAVP davp DAVP类型云服务器,其中搭载了DaoCloud DAVP1视频加速卡。 该取值可通过云监控服务的“查询主机监控维度指标信息”获取。
  • 操作系统监控指标:NPU 表11 NPU类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) npu_device_health NPU健康状况 该指标用于统计虚拟机上NPU卡的健康状态,是一个综合指标。 该指标无单位。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0:代表健康 1:代表存在一般告警 2:代表存在重要告警 3:代表存在紧急告警 云服务器 云服务器 - NPU 1分钟 npu_util_rate_mem NPU显存使用率 该指标用于统计该NPU的编码能力使用率。 单位:百分比 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_ai_core NPU卡AI核心使用率 该指标用于统计该NPU的AI核心使用率。 单位:百分比 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_ai_cpu NPU卡AI CPU使用率 该指标用于统计该NPU的AI CPU的使用率。 单位:百分比。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_ctrl_cpu NPU控制CPU使用率 该指标用于统计该NPU的控制CPU的使用率。 单位:百分比。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_util_rate_mem_bandwidth NPU显存带宽使用率 该指标用于统计该NPU的显存的带宽使用率。 单位:百分比。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 0-100% 云服务器 云服务器 - NPU 1分钟 npu_freq_mem NPU显存频率 该指标用于统计该NPU的显存的时钟频率。 单位:兆赫兹(MHz)。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_freq_ai_core NPU卡AI核心频率 该指标用于统计该NPU AI核心的时钟频率。 单位:兆赫兹(MHz)。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_usage_mem NPU显存使用量 该指标用于统计该NPU 显存的使用量。 单位:兆Byte(MB)。 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_sbe NPU单bit错误数量 该指标用于统计该NPU卡当前的单比特页错误的数量。 单位:个 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_dbe NPU双bit错误数量 该指标用于统计该NPU卡当前的多比特页错误的数量。 单位:个 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_power NPU功率 该指标用于统计该NPU卡的功率。其中,310卡仅支持显示额定功率,其余卡显示实际功率 单位:瓦(W) 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 npu_temperature NPU温度 该指标用于统计该NPU卡当前的温度 单位:摄氏度(℃) 采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。 ≥ 0 云服务器 云服务器 - NPU 1分钟 Windows系统暂不支持NPU类监控指标。
  • 操作系统监控指标:GPU 表10 GPU类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) gpu_status gpu健康状态 该指标用于统计虚拟机上GPU健康状态,是一个综合指标。 该指标无单位。 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0:代表健康 1:代表亚健康 2:代表故障 云服务器 云服务器 - GPU 1分钟 gpu_usage_encoder 编码使用率 该指标用于统计该GPU的编码能力使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_usage_decoder 解码使用率 该指标用于统计该GPU的解码能力使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_volatile_correctable 可纠正ECC错误数量 该指标用于统计该GPU重置以来可纠正的ECC错误数量,每次重置后归0。 单位:个。 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_volatile_uncorrectable 不可纠正ECC错误数量 该指标用于统计该GPU重置以来不可纠正的ECC错误数量,每次重置后归0。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_aggregate_correctable 累计可纠正ECC错误数量 该指标用于统计该GPU累计的可纠正ECC错误数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_aggregate_uncorrectable 累计不可纠正ECC错误数量 该指标用于统计该GPU累计的不可纠正ECC错误数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_retired_page_single_bit retired page single bit错误数量 该指标用于统计该GPU当前卡隔离的单比特页的数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_retired_page_double_bit retired page double bit错误数量 该指标用于统计该GPU当前卡隔离的双比特页的数量。 单位:个 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 云服务器 云服务器 - GPU 1分钟 gpu_performance_state (Agent) 性能状态 该指标用于统计测量对象当前的GPU性能状态。 该指标无单位。 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 P0-P15、P32, P0:表示最大性能状态 P15:表示最小性能状态 P32:表示状态未知 云服务器 云服务器 - GPU 1分钟 gpu_usage_mem (Agent) 显存使用率 该指标用于统计测量对象当前的显存使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_usage_gpu (Agent) GPU使用率 该指标用于统计测量对象当前的GPU使用率。 单位:百分比 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% 云服务器 云服务器 - GPU 1分钟 gpu_free_mem GPU显存剩余量 该指标用于统计测量对象当前的GPU显存剩余量。 单位:MB 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MB 云服务器 云服务器 - GPU 1分钟 gpu_graphics_clocks GPU显卡时钟频率 该指标用于统计测量对象当前的GPU显卡(着色器)时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟 gpu_mem_clocks GPU内存时钟频率 该指标用于统计测量对象当前的GPU内存时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟 gpu_power_draw GPU功率 该指标用于统计测量对象当前的GPU功率。 单位:W 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 NA 云服务器 云服务器 - GPU 1分钟 gpu_rx_throughput_pci GPU PCI入方向带宽 该指标用于统计测量对象当前的GPU PCI入方向带宽。 单位:MByte/s 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MByte/s 云服务器 云服务器 - GPU 1分钟 gpu_sm_clocks GPU流式处理器时钟频率 该指标用于统计测量对象当前的GPU流式处理器时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟 gpu_temperature GPU温度 该指标用于统计测量对象当前的GPU温度。 单位:℃ 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 ℃ 云服务器 云服务器 - GPU 1分钟 gpu_tx_throughput_pci GPU PCI出方向带宽 该指标用于统计测量对象当前的GPU PCI出方向带宽。 单位:MByte/s 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MByte/s 云服务器 云服务器 - GPU 1分钟 gpu_used_mem GPU显存使用量 该指标用于统计测量对象当前的GPU显存使用量。 单位:MB 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MB 云服务器 云服务器 - GPU 1分钟 gpu_video_clocks GPU视频时钟频率 该指标用于统计测量对象当前的GPU视频(包含编解码)时钟频率。 单位:MHz 采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。 采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 MHz 云服务器 云服务器 - GPU 1分钟
  • 操作系统监控指标:网卡 表7 网卡相关监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) net_bitRecv (Agent) 出网带宽 该指标用于统计测量对象网卡每秒发送的比特数。 单位:bit/s 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。 ≥ 0 bit/s 云服务器 1分钟 net_bitSent (Agent) 入网带宽 该指标用于统计测量对象网卡每秒接收的比特数。 单位:bit/s 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。 ≥ 0 bit/s 云服务器 1分钟 net_packetRecv (Agent) 网卡包接收速率 该指标用于统计测量对象网卡每秒接收的数据包数。 单位:Counts/s 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。 ≥ 0 Counts/s 云服务器 1分钟 net_packetSent (Agent) 网卡包发送速率 该指标用于统计测量对象网卡每秒发送的数据包数。 单位:Counts/s 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。 ≥ 0 Counts/s 云服务器 1分钟 net_errin (Agent) 接收误包率 该指标用于统计测量对象网卡每秒接收的错误数据包数量占所接收的数据包的比率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟 net_errout (Agent) 发送误包率 该指标用于统计测量对象网卡每秒发送的错误数据包数量占所发送的数据包的比率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟 net_dropin (Agent) 接收丢包率 该指标用于统计测量对象网卡每秒接收并已丢弃的数据包数量占所接收的数据包的比率 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟 net_dropout (Agent) 发送丢包率 该指标用于统计测量对象网卡每秒发送并已丢弃的数据包数量占所发送的数据包的比率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟
  • 操作系统监控指标:TCP 表9 TCP类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) net_tcp_total (Agent) TCP TOTAL 该指标用于统计测量对象所有状态的TCP连接数总和。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_established (Agent) TCP ESTABLISHED 该指标用于统计测量对象处于ESTABLISHED状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_sys_sent (Agent) TCP SYS_SENT 该指标用于统计测量对象处于请求连接状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_sys_recv (Agent) TCP SYS_RECV 该指标用于统计测量对象服务器端收到的请求连接的TCP数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_fin_wait1 (Agent) TCP FIN_WAIT1 该指标用于统计测量对象客户端主动关闭且没有收到服务端ACK的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_fin_wait2 (Agent) TCP FIN_WAIT2 该指标用于统计测量对象处于FIN_WAIT2状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_time_wait (Agent) TCP TIME_WAIT 该指标用于统计测量对象处于TIME_WAIT状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_close (Agent) TCP CLOSE 该指标用于统计测量对象关闭的或未打开的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_close_wait (Agent) TCP CLOSE_WAIT 该指标用于统计测量对象处于CLOSE_WAIT状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_last_ack (Agent) TCP LAST_ACK 该指标用于统计测量对象被动关闭等待ACK报文的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_listen (Agent) TCP LISTEN 该指标用于统计测量对象处于LISTEN状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_closing (Agent) TCP CLOSING 该指标用于统计测量对象处于服务端和客户端同时主动关闭状态的TCP连接数量。 单位:Count 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云服务器 1分钟 net_tcp_retrans (Agent) TCP重传率 该指标用于统计测量对象重新发送的报文数与总发送的报文数之间的比值。 单位:百分比 采集方式(Linux):通过从/proc/net/snmp文件中获取对应的数据,计算采集周期内发送包数和重传包数的比值得出。 采集方式(Windows):重传率通过WindowsAPI GetTcpStatistics获取 0-100% 云服务器 1分钟
  • 操作系统监控指标:文件系统 表6 文件系统类监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) disk_fs_rwstate (Agent) 文件系统读写状态 该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。 采集方式(Linux):通过读取/proc/mounts中第四列文件系统挂载参数获得。 0:可读写 1:只读 云服务器 - 挂载点 1分钟 disk_inodesTotal (Agent) inode空间大小 该指标用于统计测量对象当前磁盘的inode空间量。 采集方式(Linux):执行df -i命令,查看Inodes列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 ≥ 0 云服务器 - 挂载点 1分钟 disk_inodesUsed (Agent) inode已使用空间 该指标用于统计测量对象当前磁盘已使用的inode空间量。 采集方式(Linux):执行df -i命令,查看IUsed列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 ≥ 0 云服务器 - 挂载点 1分钟 disk_inodesUsedPercent (Agent) inode已使用占比 该指标用于统计测量对象当前磁盘已使用的inode占比。 单位:百分比 采集方式(Linux):执行df -i命令,查看IUse%列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 0-100% 云服务器 - 挂载点 1分钟 Windows系统暂不支持文件系统类监控指标。
  • 操作系统监控指标:磁盘 目前仅支持物理磁盘指标的采集,不支持通过网络文件系统协议挂载的磁盘。 会默认屏蔽docker相关的挂载点。挂载点前缀如下: /var/lib/docker;/mnt/paas/kubernetes;/var/lib/mesos 表4 磁盘相关监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) disk_free (Agent) 磁盘剩余存储量 该指标用于统计测量对象磁盘的剩余存储空间。 单位:GB 采集方式(Linux):执行df -h命令,查看Avail列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 ≥0 GB 云服务器 - 挂载点 1分钟 disk_total (Agent) 磁盘存储总量 该指标用于统计测量对象磁盘存储总量。 单位:GB 采集方式(Linux):执行df -h命令,查看Size列数据。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 ≥0 GB 云服务器 - 挂载点 1分钟 disk_used (Agent) 磁盘已用存量 该指标用于统计测量对象磁盘的已用存储空间。 单位:GB 采集方式(Linux):执行df -h命令,查看Used列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 ≥0 GB 云服务器 - 挂载点 1分钟 disk_usedPercent (Agent) 磁盘使用率 该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。 单位:百分比 采集方式(Linux):通过计算Used/Size得出。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 0-100% 云服务器 - 挂载点 1分钟
  • 操作系统监控指标:磁盘I/O 表5 磁盘I/O相关监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) disk_agt_read_bytes_rate (Agent) 磁盘读速率 该指标用于统计每秒从测量对象读出数据量。 单位:Byte/s 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化得出磁盘读速率。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows): 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。 ≥ 0 Byte/s 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_agt_read_requests_rate (Agent) 磁盘读操作速率 该指标用于统计每秒从测量对象读取数据的请求次数。 单位:请求/秒 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第四列数据的变化得出磁盘读操作速率。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows): 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。 ≥ 0 请求/秒 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_agt_write_bytes_rate (Agent) 磁盘写速率 该指标用于统计每秒写到测量对象的数据量。 单位:Byte/s 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化得出磁盘写速率。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows): 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。 ≥ 0 Byte/s 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_agt_write_requests_rate (Agent) 磁盘写操作速率 该指标用于统计每秒向测量对象写数据的请求次数。 单位:请求/秒 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第八列数据的变化得出磁盘写操作速率。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows): 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。 ≥ 0 请求/秒 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_readTime (Agent) 读操作平均耗时 该指标用于统计测量对象磁盘读操作平均耗时。 单位:ms/Count 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第七列数据的变化得出磁盘读操作平均耗时。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 ≥ 0 ms/Count 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_writeTime (Agent) 写操作平均耗时 该指标用于统计测量对象磁盘写操作平均耗时。 单位:ms/Count 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第十一列数据的变化得出磁盘写操作平均耗时。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 ≥ 0 ms/Count 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_ioUtils (Agent) 磁盘I/O使用率 该指标用于统计测量对象磁盘I/O使用率。 单位:百分比 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化得出磁盘I/O使用率。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 0-100% 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_queue_length (Agent) 平均队列长度 该指标用于统计指定时间段内,平均等待完成的读取或写入操作请求的数量 单位:个 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第十四列数据的变化得出磁盘平均队列长度。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 ≥ 0 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_write_bytes_per_operation (Agent) 平均写操作大小 该指标用于统计指定时间段内,平均每个写I/O操作传输的字节数。 单位:Byte/op 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化与第八列数据的变化相除得出磁盘平均写操作大小。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 ≥ 0 Byte/op 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_read_bytes_per_operation (Agent) 平均读操作大小 该指标用于统计指定时间段内,平均每个读I/O操作传输的字节数。 单位:Byte/op 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化与第四列数据的变化相除得出磁盘平均读操作大小。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 ≥ 0 Byte/op 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_io_svctm (Agent) 平均I/O服务时长 该指标用于统计指定时间段内,平均每个读或写I/O的操作时长。 单位:ms/op 采集方式(Linux): 通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化与第四列数据和第八列数据和的变化相除得出磁盘平均I/O时长。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。 采集方式(Windows):暂不支持。 ≥ 0 ms/op 云服务器 - 磁盘 云服务器 - 挂载点 1分钟 disk_device_used_percent 块设备使用率 该指标用于统计测量对象物理磁盘使用率,以百分比为单位。计算方式为: 所有已挂载磁盘分区已用存储量/磁盘存储总量。 采集方式(Linux):通过汇总每个挂载点的磁盘使用量,在通过磁盘扇区大小和扇区数量计算出磁盘总大小,计算出整体磁盘使用率 (Windows):暂不支持。 0-100% 云服务器 - 磁盘 1分钟
  • 操作系统监控指标:CPU负载 表2 CPU负载指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) load_average1 (Agent) 1分钟平均负载 该指标用于统计测量对象过去1分钟的CPU平均负载。 采集方式(Linux):通过/proc/loadavg中load1/逻辑CPU个数得到。用户可以通过top命令查看load1值。 ≥0 云服务器 1分钟 load_average5 (Agent) 5分钟平均负载 该指标用于统计测量对象过去5分钟的CPU平均负载。 采集方式(Linux):通过/proc/loadavg中load5/逻辑CPU个数得到。用户可以通过top命令查看load5值。 ≥0 云服务器 1分钟 load_average15 (Agent) 15分钟平均负载 该指标用于统计测量对象过去15分钟的CPU平均负载。 采集方式(Linux):通过/proc/loadavg中load15/逻辑CPU个数得到。用户可以通过top命令查看load15值。 ≥0 云服务器 1分钟 Windows系统暂不支持CPU负载指标。
  • 操作系统监控指标:内存 表3 内存相关监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) mem_available (Agent) 可用内存 该指标用于统计测量对象的可用内存。 单位:GB 采集方式(Linux):通过/proc/meminfo文件获取, 若/proc/meminfo中显示MemAvailable,则直接可得 若/proc/meminfo中不显示MemAvailable,则MemAvailable=MemFree+Buffers+Cached 采集方式(Windows):计算方法为(内存总量-已用内存量)。通过WindowsAPI GlobalMemoryStatusEx获取。 ≥0 GB 云服务器 1分钟 mem_usedPercent (Agent) 内存使用率 该指标用于统计测量对象的内存使用率。 单位:百分比 采集方式(Linux):通过/proc/meminfo文件获取,(MemTotal-MemAvailable)/MemTotal 若/proc/meminfo中显示MemAvailable,则MemUsedPercent=(MemTotal-MemAvailable)/MemTotal 若/proc/meminfo中不显示MemAvailable,则MemUsedPercent=(MemTotal-MemFree-Buffers-Cached)/MemTotal 采集方式(Windows):计算方法为( 已用内存量/内存总量*100%)。 0-100% 云服务器 1分钟 mem_free (Agent) 空闲内存量 该指标用于统计测量对象的空闲内存量。 单位:GB 采集方式(Linux):通过/proc/meminfo获取。 采集方式(Windows):暂不支持。 ≥0 GB 云服务器 1分钟 mem_buffers (Agent) Buffers占用量 该指标用于统计测量对象的Buffers内存量。 单位:GB 采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Mem:buffers值。 采集方式(Windows):暂不支持。 ≥0 GB 云服务器 1分钟 mem_cached (Agent) Cache占用量 该指标用于统计测量对象Cache内存量。 单位:GB 采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Swap:cached Mem值。 采集方式(Windows):暂不支持。 ≥0 GB 云服务器 1分钟 total_open_files (Agent) 文件句柄总数 该指标用于统计测量对象的所有进程使用的句柄总和。 单位:个 采集方式(Linux):通过/proc/{pid}/fd文件汇总所有进程使用的句柄数。 采集方式(Windows):暂不支持。 ≥0 云服务器 1分钟
  • 操作系统监控指标:CPU 表1 CPU相关监控指标说明 指标 指标名称 指标含义 取值范围 测量对象(维度) 监控周期(原始指标) cpu_usage (Agent) CPU使用率 该指标用于统计测量对象当前CPU使用率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s)值。 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。 0-100% 云服务器 1分钟 cpu_usage_idle (Agent) CPU空闲时间占比 该指标用于统计测量对象当前CPU空闲时间占比。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU空闲时间占比。 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。 0-100% 云服务器 1分钟 cpu_usage_user (Agent) 用户空间CPU使用率 该指标用于统计测量对象当前用户空间占用CPU使用率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s) us值。 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。 0-100% 云服务器 1分钟 cpu_usage_system (Agent) 内核空间CPU使用率 该指标用于统计测量对象当前内核空间占用CPU使用率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出内核空间CPU使用率。用户可以通过top命令查看 %Cpu(s) sy值。 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。 0-100% 云服务器 1分钟 cpu_usage_other (Agent) 其他CPU使用率 该指标用于统计测量对象其他占用CPU使用率。 单位:百分比 采集方式(Linux):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。 采集方式(Windows):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。 0-100% 云服务器 1分钟 cpu_usage_nice (Agent) Nice进程CPU使用率 该指标用于统计测量对象当前Nice进程CPU使用率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出Nice进程CPU使用率。用户可以通过top命令查看 %Cpu(s) ni值。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟 cpu_usage_iowait (Agent) iowait状态占比 该指标用于统计测量对象当前iowait状态占用CPU的比率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出iowait状态占比。用户可以通过top命令查看 %Cpu(s) wa值。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟 cpu_usage_irq (Agent) CPU中断时间占比 该指标用于统计测量对象当前CPU处理中断用时占用CPU时间的比率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU中断时间占比。用户可以通过top命令查看 %Cpu(s) hi值。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟 cpu_usage_softirq (Agent) CPU软中断时间占比 该指标用于统计测量对象当前CPU处理软中断时间占用CPU时间的比率。 单位:百分比 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU软中断时间占比。用户可以通过top命令查看 %Cpu(s) si值。 采集方式(Windows):暂不支持。 0-100% 云服务器 1分钟
共100000条