云服务器内容精选

  • 支持采集的Windows主机监控指标 当前支持采集的监控指标如表2所示。 表2 Windows主机监控指标说明 指标名称 指标含义 取值范围 单位 ops_node_cpu_usage 该指标用于统计测量对象的CPU使用率。 0~100% 百分比(Percent) ops_node_cpu_limit_core 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) ops_node_cpu_used_core 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) ops_node_disk_capacity_megabytes 总的磁盘空间容量。 ≥0 兆字节(Megabytes) ops_node_disk_available_capacity_megabytes 还未经使用的磁盘空间。 ≥0 兆字节(Megabytes) ops_node_disk_usage 已使用的磁盘空间占总的磁盘空间容量百分比。 ≥0 百分比(Percent) ops_node_virtual_memory_total_megabytes 该指标用于统计测量对象上的虚拟内存总量。 ≥0 兆字节(Megabytes) ops_node_virtual_memory_usage 该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。 0~100% 百分比(Percent) ops_node_memory_total_megabytes 该指标用于统计测量申请的物理内存总量。 ≥0 兆字节(Megabytes) ops_node_virtual_memory_free_megabytes 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(Megabytes) ops_node_memory_free_megabytes 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(Megabytes) ops_node_memory_usage 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 0~100% 百分比(Percent) ops_node_process_number 该指标用于统计测量对象上的进程数量。 ≥0 无 ops_node_network_receive_bytes 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Bytes/Second) ops_node_network_receive_packets 每秒网卡接收的数据包个数。 ≥0 个/秒(Packets/Second) ops_node_network_receive_error_packets 每秒网卡接收的错误包个数。 ≥0 个/秒(Packets/Second) ops_node_network_transmit_bytes 该指标用于统计测试对象的出方向网络流速。 ≥0 字节/秒(Bytes/Second) ops_node_network_transmit_packets 每秒网卡发送的数据包个数。 ≥0 个/秒(Packets/Second) ops_node_network_transmit_error_packets 每秒网卡发送的错误包个数。 ≥0 个/秒(Packets/Second) ops_node_network_total_bytes 该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Bytes/Second) ops_node_network_total_packets 每秒网卡处理的数据包个数。 ≥0 个/秒(Packets/Second) ops_node_disk_read_kilobytes 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(Kilobytes/Second) ops_node_disk_write_kilobytes 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(Kilobytes/Second) ops_node_disk_read_io_num 该指标用于统计每秒从磁盘读的次数。 ≥0 个/秒(Packets/Second) ops_node_disk_write_io_num 该指标用于统计每秒向磁盘写的次数。 ≥0 个/秒(Packets/Second) ops_node_disk_kilobytes 该指标用于统计每秒磁盘的IO数据量。 ≥0 千字节/秒(Kilobytes/Second) ops_node_disk_util 该指标用于统计磁盘使用时间。 ≥0 百分比(Percent)
  • 实例监控指标 数据复制服务 性能监控指标,如表1所示。 表1 数据复制服务支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率,以比率为单位。 0-100% 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 mem_util 内存使用率 该指标用于统计测量对象的内存使用率,以比率为单位。 0-100% 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 network_incoming_bytes_rate 网络输入吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输入的流量,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 network_outgoing_bytes_rate 网络输出吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输出的流量,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 disk_read_bytes_rate 磁盘读吞吐量 该指标用于统计每秒从磁盘读取的字节数,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 disk_write_bytes_rate 磁盘写吞吐量 该指标用于统计每秒写入磁盘的字节数,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 disk_util 磁盘利用率 该指标用于统计测量对象的磁盘利用率,以比率为单位。 0-100% 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 extract_bytes_rate 读源库吞吐量 该指标用于统计每秒从源库读取表数据或者WAL的字节数。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 extract_rows_rate 读源库频率 该指标用于统计每秒从源库读取表数据或者WAL的行数,以行/秒为单位。 ≥ 0 row/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 extract_latency 源库WAL抽取延迟 该指标用于统计当前从源库抽取WAL的延迟,以毫秒为单位。 ≥ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_bytes_rate 写目标库吞吐量 该指标用于统计每秒向目标库写入数据的字节数,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_rows_rate 写目标库频率 该指标用于统计每秒向目标库写入数据的行数,以行/秒为单位。 ≥ 0 row/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_transactions_rate DML TPS 该指标用于统计每秒向目标库写入的DML事务数,以事务/秒为单位。 ≥ 0 transaction/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_ddls_number或apply_ddls_rate 说明: apply_ddls_rate在2022年12月之后替换为apply_ddls_number。 DDL TPS 该指标用于统计向目标库写入的DDL事务总数。 ≥ 0 transaction 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_latency 数据同步延迟 该指标用于统计当前数据向目标库回放延迟,以毫秒为单位。 ≥ 0 ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_average_execute_time 事务平均执行时间 该指标用于统计当前一个事务在目标库的平均执行时间(一个事务的RT=执行时间+提交时间),以毫秒为单位。 ≥ 0 ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_average_commit_time 事务平均提交时间 该指标用于统计当前一个事务在目标库的平均提交时间(一个事务的RT=执行时间+提交时间),以毫秒为单位。 ≥ 0 ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_current_state 同步状态 该指标用于表示当前内核数据的同步状态(10:异常,1:空闲,2:执行DML,3:执行DDL),不代表任务状态。 10:异常 1:空闲 2:执行DML 3:执行DDL 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_thread_workers 同步线程数量 该指标用于表示当前数据同步的工作线程数量。 ≥ 0 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_job_status 任务状态 该指标用于表示当前任务所处的状态(0:正常,1:异常,2:暂停)。 0:正常 1:异常 2:暂停 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟
  • 实例监控指标 数据复制服务性能监控指标,如表1所示。 表1 数据复制服务支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率,以比率为单位。 0-100% 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 mem_util 内存使用率 该指标用于统计测量对象的内存使用率,以比率为单位。 0-100% 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 network_incoming_bytes_rate 网络输入吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输入的流量,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 network_outgoing_bytes_rate 网络输出吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输出的流量,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 disk_read_bytes_rate 磁盘读吞吐量 该指标用于统计每秒从磁盘读取的字节数,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 disk_write_bytes_rate 磁盘写吞吐量 该指标用于统计每秒写入磁盘的字节数,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 disk_util 磁盘利用率 该指标用于统计测量对象的磁盘利用率,以比率为单位。 0-100% 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 extract_bytes_rate 读源库吞吐量 该指标用于统计每秒从源库读取表数据或者WAL的字节数。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 extract_rows_rate 读源库频率 该指标用于统计每秒从源库读取表数据或者WAL的行数,以行/秒为单位。 ≥ 0 row/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 extract_latency 源库WAL抽取延迟 该指标用于统计当前从源库抽取WAL的延迟,以毫秒为单位。 ≥ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_bytes_rate 写目标库吞吐量 该指标用于统计每秒向目标库写入数据的字节数,以字节/秒为单位。 ≥ 0 byte/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_rows_rate 写目标库频率 该指标用于统计每秒向目标库写入数据的行数,以行/秒为单位。 ≥ 0 row/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_transactions_rate DML TPS 该指标用于统计每秒向目标库写入的DML事务数,以事务/秒为单位。 ≥ 0 transaction/s 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_ddls_number或apply_ddls_rate 说明: apply_ddls_rate在2022年12月之后替换为apply_ddls_number。 DDL TPS 该指标用于统计向目标库写入的DDL事务总数。 ≥ 0 transaction 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_latency 数据同步延迟 该指标用于统计当前数据向目标库回放延迟,以毫秒为单位。 ≥ 0 ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_average_execute_time 事务平均执行时间 该指标用于统计当前一个事务在目标库的平均执行时间(一个事务的RT=执行时间+提交时间),以毫秒为单位。 ≥ 0 ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_average_commit_time 事务平均提交时间 该指标用于统计当前一个事务在目标库的平均提交时间(一个事务的RT=执行时间+提交时间),以毫秒为单位。 ≥ 0 ms 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_current_state 同步状态 该指标用于表示当前内核数据的同步状态(10:异常,1:空闲,2:执行DML,3:执行DDL),不代表任务状态。 10:异常 1:空闲 2:执行DML 3:执行DDL 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_thread_workers 同步线程数量 该指标用于表示当前数据同步的工作线程数量。 ≥ 0 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟 apply_job_status 任务状态 该指标用于表示当前任务所处的状态(0:正常,1:异常,2:暂停)。 0:正常 1:异常 2:暂停 测量对象:弹性云服务器 监控实例类型:实时迁移、实时同步和实时灾备实例 1分钟
  • 返回值 正常 200 异常 返回值 说明 400 Bad Request 请求错误。 401 Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。
  • URI GET /V1.0/{project_id}/metric-data 样例: GET /V1.0/{project_id}/metric-data?namespace={namespace}&metric_name={metric_name}&dim.{i}=key,value&from={from}&to={to}&period={period}&filter={filter} 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 表2 查询检索参数 名称 是否必选 参数类型 说明 namespace 是 String 服务的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 metric_name 是 String 指标名称,可通过查询指标列表获取已有的告警规则的指标名。 from 是 Integer 查询数据起始时间,UNIX时间戳,单位毫秒(ms)。 由于聚合运算的过程是将一个聚合周期范围内的数据点聚合到周期起始边界上,如果将from和to的范围设置在聚合周期内,会因为聚合未完成而造成查询数据为空,所以建议from参数相对于当前时间向前偏移至少1个周期。 以5分钟聚合周期为例:假设当前时间点为10:35,10:30~10:35之间的原始数据会被聚合到10:30这个点上,所以查询5分钟数据点时from参数应为10:30。 说明: 云监控 会根据所选择的聚合粒度向前取整from参数。 to 是 Integer 查询数据截止时间UNIX时间戳,单位毫秒(ms)。from必须小于to。 period 是 Integer 监控数据粒度。 取值范围: 1,实时数据 300,5分钟粒度 1200,20分钟粒度 3600,1小时粒度 14400,4小时粒度 86400,1天粒度 filter 是 String 数据聚合方式,支持的聚合方式如下: average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 说明: 聚合运算的过程是将一个聚合周期范围内的数据点根据相应的聚合算法聚合到周期起始边界上,以5分钟聚合周期为例:假设当前时间点为10:35,则10:30~10:35之间的原始数据会被聚合到10:30这个时间点。 dim 是 String 指标的维度,目前最大支持4个维度,维度编号从0开始;维度格式为dim.{i}=key,value,key的最大长度32,value的最大长度为256。 CloudTable仅支持多维度查询。 以下维度说明仅为示例,具体是否支持多维度请参见各服务中监控指标说明中的维度说明。 单维度:dim.0=instance_id,i-12345 多维度:dim.0=instance_id,i-12345&dim.1=instance_name,i-1234 对于dim字段的内容,可通过调用查询指标列表接口,在其响应体的相关指标数据中获取。 对于OBS相关指标数据,当进行了相关OBS接口操作时可查询到相关指标数据,否则查询结果为空。 对于EVS相关指标数据,disk_name维度下,它的返回值有云服务器实例ID-盘符名和云服务器实例ID-volume-卷ID两种。 云服务器实例ID-盘符名,例如:6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d-vda(vda为盘符名)。 云服务器实例ID-volume-卷ID,例如:6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d-volume-31f45764-38b3-44ad-aaca-4015c83371e6。 样例: 请求样例一:查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟的监控数据。 GET https://{云监控的endpoint}/V1.0/{project_id}/metric-data?namespace=SYS.E CS &metric_name=cpu_util&dim.0=instance_id,6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d&from=1556625600000&to=1556632800000&period=1200&filter=min 请求样例二:查询CloudTable服务维度分别是cluster_id为f2fbxxxc-36b2-4d1d-895d-972a4d656xxx和instance_name为hmaster-active的监控指标cmdProcessMem,在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟的监控数据。 GET https://{云监控的endpoint}/V1.0/{project_id}/metric-data?namespace=SYS.CloudTable&metric_name=cmdProcessMem&dim.0=cluster_id,f2fbxxxc-36b2-4d1d-895d-972a4d656xxx&dim.1=instance_name,hmaster-active&from=1556625600000&to=1556632800000&period=1200&filter=variance
  • 响应消息 响应参数 表3 响应参数 名称 参数类型 说明 datapoints Array of objects 指标数据列表。详细参数请参见表4。 由于查询数据时,云监控会根据所选择的聚合粒度向前取整from参数,所以datapoints中包含的数据点有可能会多于预期。 metric_name String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表4 datapoints字段数据结构说明 名称 参数类型 说明 average Double 聚合周期内指标数据的平均值。 max Double 聚合周期内指标数据的最大值。 min Double 聚合周期内指标数据的最小值。 sum Double 聚合周期内指标数据的求和值。 variance Double 聚合周期内指标数据的方差。 timestamp Long 指标采集时间,UNIX时间戳,单位毫秒。 unit String 指标单位。 响应样例 响应样例一:维度为SYS.ECS,响应弹性云服务器,CPU使用率的平均值。 { "datapoints": [ { "average": 0.23, "timestamp": 1442341200000, "unit": "%" } ], "metric_name": "cpu_util" } 响应样例二:维度为SYS.ECS,响应弹性云服务器,CPU使用率的求和值。 { "datapoints": [ { "sum": 0.53, "timestamp": 1442341200000, "unit": "%" } ], "metric_name": "cpu_util" } 响应样例三:维度为SYS.ECS,响应弹性云服务器,CPU使用率的最大值。 { "datapoints": [ { "max": 0.13, "timestamp": 1442341200000, "unit": "%" } ], "metric_name": "cpu_util" }
  • 支持监控的服务列表 分类 服务 命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID Key:disk Value:磁盘 Key:mount_point Value:挂载点 Key:gpu Value:GPU Key:proc Value:进程 弹性云服务器操作系统监控的监控指标(安装Agent) 裸金属服务器 SERVICE.BMS Key:instance_id Value:云服务器ID 裸金属服务器操作系统监控的监控指标(安装Agent) 弹性伸缩 SYS.AS Key:AutoScalingGroup Value:弹性伸缩组的ID 弹性伸缩的监控指标说明 云手机服务器 SYS.CPH Key:instance_id Value:云手机服务器ID Key:cph_id Value:云手机ID Key:disk_name Value:磁盘名称 Key:gpu_index Value:GPU名称 云手机服务器的监控指标说明 函数工作流 服务 SYS.FunctionGraph Key:package-functionname Value:应用名-函数名 函数工作流服务的监控指标说明 存储 云硬盘(仅当挂载到云服务器时) SYS.EVS Key:disk_name Value:云服务器实例ID-盘符名(例如sda为盘符名) 云硬盘的监控指标说明 对象存储服务 SYS.OBS Key:bucket_name Value:桶名 Key:tenant_id Value:租户Id Key:api_name Value:接口 Key:http_code Value:HTTP返回码 Key:domain_name Value: 域名 对象存储服务监控指标说明 弹性文件服务 SYS.SFS Key:share_id Value:文件系统 弹性文件服务监控指标说明 云备份 SYS.CBR Key:instance_id Value:存储库名称/ID 云备份监控指标说明 云存储 网关 SYS.CSG Key:gateway_id Value:网关ID 云存储网关监控指标说明 弹性文件服务Turbo SYS.EFS Key:efs_instance_id Value:实例 SFS Turbo监控指标说明 网络 弹性公网IP和带宽 SYS.VPC Key:publicip_id Value:弹性公网IP ID Key:bandwidth_id Value:带宽ID 虚拟私有云的监控指标说明 弹性负载均衡 SYS.ELB Key:lbaas_pool_id Value:后端服务器组的ID Key:lbaas_instance_id Value:独享/共享型负载均衡器的ID Key:lbaas_listener_id Value:独享/共享型负载均衡监听器的ID 弹性负载均衡的监控指标说明 云专线 SYS.DCAAS Key:direct_connect_id Value:物理连接 Key:history_direct_connect_id Value:历史物理连接 Key:virtual_interface_id Value:虚拟接口 Key:virtual_gateway_id Value:虚拟网关 云专线的监控指标说明 虚拟专用网络 SYS.VPN Key:connection_id Value:VPN连接 虚拟专用网络的监控指标说明 NAT网关 SYS.NAT Key:nat_gateway_id Value:NAT网关实例标识 Key:vpc_nat_gateway_id Value:私网NAT实例标识 NAT网关的监控指标说明 企业路由器 SYS.ER Key:er_instance_id Value:企业路由器实例 Key:er_attachment_id Value:企业路由器连接 企业路由器的监控指标说明 云连接 SYS.CC Key:cloud_connect_id Value:云连接ID Key:bwp_id Value:带宽包ID Key:region_bandwidth_id Value:域间带宽ID 云连接的监控指标说明 全球加速 SYS.GA Key:ga_accelerator_id Value:全球加速实例的ID Key:ga_listener_id Value:全球加速监听器的ID Key:ga_source_pop Value:全球加速实例的接入点 Key:ga_destination_region Value:全球加速实例的目的区域 Key:ga_source_area Value:全球加速实例的接入大区 Key:ga_listener_region Value:全球加速监听器和目的区域 Key:ga_pop_listener Value:全球加速接入点和监听器 Key:ga_pop_region Value:全球加速接入点和目的区域 Key:ga_pop_listener_region Value:全球加速接入点、监听器和目的区域 Key:ga_source_destination_area Vaue:全球加速接入大区和目的大区 全球加速的监控指标说明 应用中间件 分布式消息服务 SYS.DMS 请参考右侧相关文档链接页面。 分布式消息服务Kafka版的监控指标 分布式消息服务RabbitMQ的监控指标 分布式消息服务RocketMQ版的监控指标 API网关 SYS.APIG Key:api_id Value:API API网关的监控指标说明 API专享版网关 SYS.APIC Key:instance_id Value:专享版API网关 Key:api_id Value:API API网关的监控指标说明 分布式缓存服务 SYS.DCS Key:dcs_instance_id Value:Redis实例 Key:dcs_cluster_redis_node Value:数据节点 Key:dcs_cluster_proxy_node Value:Redis3.0 Proxy集群实例Proxy节点 Key:dcs_cluster_proxy2_node Value:Redis4.0/Redis5.0 Proxy集群实例Proxy节点 Key:dcs_memcached_instance_id Value:Memcached实例 分布式缓存服务的监控指标说明 应用与 数据集成平台 SYS.ROMA 请参考右侧相关文档链接页面。 应用与数据集成平台的监控指标说明 数据库 关系型数据库 SYS.RDS 请参考右侧相关文档链接页面。 MySQL的监控指标说明 PostgreSQL的监控指标说明 SQL Server的监控指标说明 文档数据库 SYS.DDS Key:mongodb_node_id Value:文档数据库节点ID Key:mongodb_instance_id Value:文档数据库实例ID 文档数据库的监控指标说明 分布式数据库 中间件 SYS.DDMS Key:node_id Value:DDM节点 分布式数据库中间件的监控指标说明 云数据库 GaussDB NoSQL SYS.NoSQL 请参考右侧相关文档链接页面。 云数据库GaussDB(for Cassandra)的监控指标说明 云数据库GaussDB(for Mongo)的监控指标说明 云数据库GaussDB(for Influx)的监控指标说明 云数据库GaussDB(for Redis)的监控指标说明 云数据库GaussDB(for MySQL) SYS.GAUSSDB Key:gaussdb_mysql_instance_id Value:GaussDB(for MySQL)实例ID Key:gaussdb_mysql_node_id Value:GaussDB(for MySQL)实例节点ID Key:dbproxy_instance_id Value:GaussDB(for MySQL)Proxy实例ID Key:dbproxy_node_id Value:GaussDB(for MySQL)Proxy节点ID 云数据库GaussDB(for MySQL)的监控指标说明 云数据库 GaussDB SYS.GAUSSDBV5 Key:gaussdbv5_instance_id Value:GaussDB实例 Key:gaussdbv5_node_id Value:GaussDB节点 Key:gaussdbv5_component_id Value:GaussDB组件 云数据库 GaussDB的监控指标说明 数据复制服务 SYS.DRS Key:instance_id Value:数据复制服务实例ID 数据复制服务的监控指标说明 迁移 云数据迁移 SYS. CDM Key:instance_id Value:云数据迁移服务实例 云数据迁移的监控指标说明 大数据 数据仓库 服务 SYS.DWS Key:datastore_id Value:数据仓库集群ID Key:dws_instance_id Value:数据仓库节点ID 数据仓库服务的监控指标说明 云搜索服务 SYS.ES Key:cluster_id Value:集群id Key:instance_id Value:实例id 云搜索 服务的监控指标说明 数据湖探索 SYS. DLI Key:queue_id Value:队列 Key:flink_job_id Value:Flink作业 Key:elastic_resource_pool_id Value:弹性资源池 数据湖 探索的监控指标说明 数据接入服务 SYS.DAYU Key:stream_id Value:实时数据接入 数据接入服务的监控指标说明 表格存储服务 SYS.CloudTable Key:cluster_id Value:CloudTable集群ID Key:instance_name Value:CloudTable集群节点名称 HBase集群的监控指标说明 Doris集群的监控指标说明 ClickHouse集群的监控指标说明 人工智能 ModelArts SYS.ModelArts Key:service_id Value:在线服务ID Key:model_id Value:模型负载ID ModelArts的监控指标说明 图像搜索 服务 SYS.IS Key:instanceName Value:实例名称 图形搜索服务的监控指标说明 图像识别 SYS.IRS Key:call_of_interface Value:接口 图像识别的监控指标说明 自然语言处理 SYS.NLP Key:call_of_interface Value:接口 自然语言处理的监控指标说明 文字识别 SYS.OCR Key:call_of_interface Value:接口 文字识别的监控指标说明 图引擎服务 SYS.GES Key:instance_id Value:图引擎服务实例 图引擎服务的监控指标说明 语音交互 服务 SYS.SIS Key:interface Value:接口 语音交互服务的监控指标说明 安全与合规 Web应用防火墙 SYS.WAF Key:instance_id Value:独享引擎实例 Key:waf_instance_id Value:云模式实例 WAF监控指标说明 数据库安全服务 SYS.DBSS Key:audit_id Value:实例 数据库安全服务的监控指标说明 云防火墙 SYS.CFW Key:fw_instance_id Value:云防火墙实例 云防火墙的监控指标说明 DDoS防护 SYS.DDOS Key:zone_ip Value:防护IP Key:instance_id Value:实例ID DDoS防护的监控指标说明 云堡垒机 SYS.CBH Key:server_id Value:CBH实例ID 云 堡垒机 的监控指标说明 企业应用 应用与数据集成平台 ROMA Connect SYS.ROMA Key:kafka_groups Value:消费组 Key:kafka_groups_topics Value:队列 Key:kafka_groups_partitions Value:分区 应用与数据集成平台的监控指标说明 CDN与智能边缘 智能边缘小站 SYS.IES Key:site_id Value:边缘小站ID 智能边缘小站的监控指标说明 内容分发网络 SYS.CDN Key:domain_name Value:域名 内容分发网络的监控指标说明 视频 视频直播 SYS.Live Key:domain Value:域名 视频直播的监控指标说明 管理与监管 消息通知 服务 SYS. SMN Key:topic_id Value:主题的ID 消息通知服务的监控指标说明 父主题: 附录
  • 操作步骤 使用ssh以root用户登录到已安装Agent的主机中。 执行以下命令,批量安装Agent,安装脚本分为batch_agent_install.sh和agentBatchPackage.sh,分别对应下面两种安装命令。 cd /usr/local && curl -k -O ${download_url} && bash batch_agent_install.sh -t ${version} cd /usr/local && curl -k -O ${download_url} && bash agentBatchPackage.sh 将安装命令中的${download_url}替换成表1中的下载路径,将${version}替换成Agent版本特性中的版本。 例如,在北京一的安装命令为: cd /usr/local && curl -k -O https://obs.cn-north-1.myhuaweicloud.com/uniagent-cn-north-1/script/batch_agent_install.sh && bash batch_agent_install.sh -t 2.5.6 安装完成后,登录 云监控服务 管理控制台,单击左侧导航栏的“主机监控”。 查看所有已安装Agent的弹性云服务器列表。 Agent插件配置完成后,因监控数据暂未上报,插件状态仍显示“未安装”,等待3-5分钟,刷新即可。
  • 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 登录方式为账号密码:已收集需要安装Agent的所有主机的IP地址和root用户密码,按照iplist.txt格式整理好,并上传到第一台机器的/usr/local目录下 iplist.txt格式为“IP地址,root用户密码”,每个保持一行。 示例如下所示(样例中abcd为密码,请按实际值填写)。 192.168.1.1,abcd 192.168.1.2,abcd 登录方式为秘钥:已收集需要安装Agent的所有ECS的IP地址,按照iplist.txt格式整理好,并上传到第一台机器的/usr/local目录下,上传秘钥文件user.pem到ECS的/usr/local目录下。 iplist.txt格式为“IP地址”,每个保持一行。 示例如下所示: 192.168.1.1 192.168.1.2 确保已下载Agent安装包,获取包的方式如下: 表1 获取Linux批量安装Agent的安装包 区域 regionID 下载路径 华北-北京一 cn-north-1 https://uniagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/package/batch_agent_install.sh 华北-北京四 cn-north-4 https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/batch_agent_install.sh 华北-乌兰察布一 cn-north-9 https://uniagent-cn-north-9.obs.cn-north-9.myhuaweicloud.com/package/batch_agent_install.sh 华南-广州 cn-south-1 https://uniagent-cn-south-1.obs.cn-south-1.myhuaweicloud.com/package/batch_agent_install.sh 华南-广州-友好用户环境 cn-south-4 https://telescope-cn-south-4.obs.cn-south-4.myhuaweicloud.com/scripts/agentBatchPackage.sh 华南-深圳 cn-south-2 https://uniagent-cn-south-2.obs.cn-south-2.myhuaweicloud.com/package/batch_agent_install.sh 华东-上海一 cn-east-3 https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/batch_agent_install.sh 华东-上海二 cn-east-2 https://uniagent-cn-east-2.obs.cn-east-2.myhuaweicloud.com/package/batch_agent_install.sh 华东-青岛 cn-east-5 https://uniagent-cn-east-5.obs.cn-east-5.myhuaweicloud.com/package/batch_agent_install.sh 西南-贵阳一 cn-southwest-2 https://uniagent-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/package/batch_agent_install.sh 中国-香港 ap-southeast-1 https://uniagent-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/package/batch_agent_install.sh 亚太-曼谷 ap-southeast-2 https://uniagent-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/package/batch_agent_install.sh 亚太-新加坡 ap-southeast-3 https://uniagent-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/package/batch_agent_install.sh 亚太-雅加达 ap-southeast-4 https://uniagent-ap-southeast-4.obs.ap-southeast-4.myhuaweicloud.com/package/batch_agent_install.sh 非洲-约翰内斯堡 af-south-1 https://uniagent-af-south-1.obs.af-south-1.myhuaweicloud.com/package/batch_agent_install.sh 拉美-圣地亚哥 la-south-2 https://uniagent-la-south-2.obs.la-south-2.myhuaweicloud.com/script/agent_install.sh 拉美-圣保罗一 sa-brazil-1 http://telescope-sa-brazil-1.obs.myhuaweicloud.com/scripts/agentBatchPackage.sh 拉美-墨西哥城一 na-mexico-1 http://telescope-na-mexico-1.obs.myhuaweicloud.com/scripts/agentBatchPackage.sh 拉美-墨西哥城二 la-north-2 https://uniagent-la-north-2.obs.la-north-2.myhuaweicloud.com/package/batch_agent_install.sh 中东-利雅得 me-east-1 https://uniagent-me-east-1.obs.me-east-1.myhuaweicloud.com/package/batch_agent_install.sh
  • 操作步骤 使用root账号,登录主机。 执行以下命令,安装Agent,安装脚本分为agent_install.sh和agentInstall.sh,分别对应以下两种命令。 新架构Agent: cd /usr/local && curl -k -O ${download_url} && bash agent_install.sh -t ${version} -r ${regionID} 老架构Agent: cd /usr/local && curl -k -O ${download_url} && bash agentInstall.sh 表1中老架构的区域包括:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一,其余都属于新架构 将${download_url} 替换成表1中的下载路径,将${version}替换成Agent版本特性中的版本,将${regionID}替换成表1中的regionID。例如,用北京一下载地址替换${download_url},对应的安装命令为: cd /usr/local && curl -k -O https://obs.cn-north-1.myhuaweicloud.com/uniagent-cn-north-1/package/agent_install.sh && bash agent_install.sh -t 2.7.2 -r cn-north-1 命令执行完成时,输出Telescope process starts successfully.则代表安装成功。 执行如下命令,清除安装脚本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope ]]; then rm /usr/local/agent_install.sh; else rm /usr/local/agentInstall.sh; fi Agent插件配置完成后,因监控数据暂未上报,插件状态仍显示“未安装”,等待3-5分钟,刷新即可。
  • 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,安装用户为root,并且安装成功后的Telescope进程不会被其他软件关闭。 确保已下载Agent安装脚本,获取脚本的方式如下: 表1 获取Linux镜像的Agent安装脚本 区域 regionID 下载路径 华北-北京一 cn-north-1 https://uniagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/package/agent_install.sh 华北-北京四 cn-north-4 https://uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/package/agent_install.sh 华北-乌兰察布一 cn-north-9 https://uniagent-cn-north-9.obs.cn-north-9.myhuaweicloud.com/package/agent_install.sh 华南-广州 cn-south-1 https://uniagent-cn-south-1.obs.cn-south-1.myhuaweicloud.com/package/agent_install.sh 华南-广州-友好用户环境 cn-south-4 https://telescope-cn-south-4.obs.cn-south-4.myhuaweicloud.com/scripts/agentInstall.sh 华南-深圳 cn-south-2 https://uniagent-cn-south-2.obs.cn-south-2.myhuaweicloud.com/package/agent_install.sh 华东-上海一 cn-east-3 https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/agent_install.sh 华东-上海二 cn-east-2 https://uniagent-cn-east-2.obs.cn-east-2.myhuaweicloud.com/package/agent_install.sh 华东-青岛 cn-east-5 https://uniagent-cn-east-5.obs.cn-east-5.myhuaweicloud.com/package/agent_install.sh 西南-贵阳一 cn-southwest-2 https://uniagent-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/package/agent_install.sh 中国-香港 ap-southeast-1 https://uniagent-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/package/agent_install.sh 亚太-曼谷 ap-southeast-2 https://uniagent-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/package/agent_install.sh 亚太-新加坡 ap-southeast-3 https://uniagent-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/package/agent_install.sh 亚太-雅加达 ap-southeast-4 https://uniagent-ap-southeast-4.obs.ap-southeast-4.myhuaweicloud.com/package/agent_install.sh 非洲-约翰内斯堡 af-south-1 https://uniagent-af-south-1.obs.af-south-1.myhuaweicloud.com/package/agent_install.sh 拉美-圣地亚哥 la-south-2 https://uniagent-la-south-2.obs.la-south-2.myhuaweicloud.com/package/agent_install.sh 拉美-圣保罗一 sa-brazil-1 https://telescope-sa-brazil-1.obs.myhuaweicloud.com/scripts/agentInstall.sh 拉美-墨西哥城一 na-mexico-1 https://telescope-na-mexico-1.obs.myhuaweicloud.com/scripts/agentInstall.sh 拉美-墨西哥城二 la-north-2 https://uniagent-la-north-2.obs.la-north-2.myhuaweicloud.com/package/agent_install.sh 中东-利雅得 me-east-1 https://uniagent-me-east-1.obs.me-east-1.myhuaweicloud.com/package/agent_install.sh
  • 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 首期支持华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)五个探测点实时监控网站,后续探测点和能力不再演进,如有诉求请使用广域网质量监控,具体操作请参见广域网质量监控(公测)。 目前站点监控功能免费。 站点监控部署在华北-北京一,若子账号无权限,需在用户所在用户组策略中勾选添加华北-北京一的权限。 图1 修改 CES 授权范围
  • 监控指标 表1 站点监控指标说明 指标ID 监控指标 说明 round_trip_time 响应时间 响应时间指站点对用户的请求做出的反应时间,即探测点和站点建立连接完成到探测点收到响应消息第一个字节的时间。 单位:毫秒。 availability 可用性 该指标以小时为周期进行统计,开通1小时后即可查看指标。 可用性 =(每小时返回正常状态数 + 每小时返回缓慢状态次数)/ 每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:2xx代表成功处理请求,3xx代表请求被重定向,4xx代表请求错误等。 probe_point_success_count 可用探测点数量 该指标用于统计正常状态探测点的个数。 probe_point_success_rate 可用探测点百分比 该指标用于统计可用探测点的百分比。 可用探测点百分比 = 正常状态的探测点个数 / 所有探测点个数 * 100% 响应时间、可用性、可用探测点数量、可用探测点百分比适用于HTTP(S)、TCP、UDP、PING探测协议,丢包率仅适用于PING探测协议,HTTP响应码仅适用于HTTP(S)探测协议。 后续会支持POP3、SMTP、DNS、FTP等标准网络协议的互联网服务可用性。
  • 选择监控对象查看监控指标 为了对比各资源的某项监控指标,您可以将多个资源的监控指标集中到一个监控制图中。但是当资源较多时,如只想对比其中的部分资源的指标数据,那么可以使用拖动选择监控对象功能。 选择监控对象:单击监控视图详情右侧的第二个图标,如图4所示。拖动选择你需要显示在监控视图详情中的监控对象,系统自动显示您选择的监控对象数据,其他监控数据则会隐藏起来。 图4 选择监控对象 重置监控对象筛选:单击监控视图详情右侧的第三个图标。 在监控视图详情窗口下方,您还可以通过以下方法选择监控对象:单击某一个资源对象关闭该监控项的走势图,再次单击该监控对象即可开启显示该指标走势。
  • 按自定义时间段查看监控指标 监控指标默认显示“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”的数据,如果您想要看近2小时或者某自定义时间段的指标时可以使用拖动选择自定义时间段功能。 按自定义时间段查看监控指标详情:单击监控视图详情右侧的第一个图标,如图3所示。拖动选择自定义时间段,系统自动展示所选时间段内的监控数据。 图3 自定义时间段 退出自定义时间段监控指标详情:单击监控视图详情右侧的第三个图标。