华为云用户手册

  • enable_user_metric_persistent 参数说明:设置是否开启用户/资源池历史资源监控转存功能。开启时,对于PG_TOTAL_USER_RESOURCE_INFO视图中数据,会定期采样保存到GS_WLM_USER_RESOURCE_HISTORY系统表中;对于GS_RESPOOL_RESOURCE_INFO视图中数据,会定期采样保存到GS_RESPOOL_RESOURCE_HISTORY系统表中。 参数类型:SIGHUP 取值范围:布尔型 on表示开启用户/资源池历史资源监控转存功能。 off表示关闭用户/资源池历史资源监控转存功能。 默认值:on
  • fast_obs_tablesize_method 参数说明:设置快速计算列存v3和v3 hstore_opt表大小的方式。该参数仅9.1.0.100及以上集群版本支持。 参数类型:USERSET 取值范围:枚举型 0:通过list obs文件的方式计算表大小。 1:wlm后台统计的方式,通过pg_relfilenode_size计算表大小。 2:通过cudesc的每个文件的最大偏移和近似估算表大小。 默认值:2
  • query_exception_count_limit 参数说明:设置作业触发异常规则次数的上限。作业触发异常规则次数达到上限后该作业会被自动加入黑名单且禁止再执行,只有移除黑名单后才能恢复运行。 参数类型:USERSET 取值范围:整型,-1~INT_MAX。 值为-1时,表示对作业触发异常规则的次数不做限制,即作业触发异常规则次数再多也不会自动将该作业加入黑名单。 值大于等于0时,表示作业触发异常规则次数达到阈值时该作业立即被加入黑名单。其中,0和1含义相同,表示只要作业触发异常规则即会将作业加入黑名单。 默认值:-1
  • resource_track_level 参数说明:设置当前会话的资源监控的等级。该参数只有当参数enable_resource_track为on时才有效。 参数类型:USERSET 取值范围:枚举型 none,不开启资源监控功能。 query,开启query级别资源监控功能,开启此功能会把SQL语句的计划信息(类似explain输出信息)记录到TopSQL中。 perf,开启perf级别资源监控功能,开启此功能会把包含实际执行时间和执行行数的计划信息(类似explain analyze输出信息)记录到TopSQL中。 operator,开启operator级别资源监控功能,开启此功能不仅会把包含实际执行时间和执行行数的信息记录到TopSQL中,还会把算子级别执行信息刷新到TopSQL中。 默认值:query
  • resource_track_subsql_duration 参数说明:设置过滤存储过程中子语句的最小执行时间。该参数仅8.2.1及以上集群版本支持。 当存储过程中子语句执行完成时,其执行时间大于此参数设置值时,作业信息会转储到TopSQL归档表中。该参数只有当enable_track_record_subsql为on时生效。 参数类型:USERSET 取值范围:整型,0~INT_MAX,单位为秒。 值为0时,存储过程中所有子语句都进行历史信息归档。 值大于0时,存储过程中子语句记录的执行时间超过设置值就会进行历史信息归档。 默认值:180s
  • use_workload_manager 参数说明:是否开启资源管理功能。该参数需在CN和DN同时应用。 参数类型:SIGHUP 取值范围:布尔型 on表示打开资源管理。 off表示关闭资源管理。 当使用GUC参数设置来修改参数值时,新参数值只能对更改操作执行后启动的线程生效。此外,对于后台线程以及线程复用执行的新作业,该参数值的改动不会生效。如果希望这类线程即时识别参数变化,可以使用kill session或重启节点的方式来实现。 use_workload_manager参数由off变为on状态后,资源管理视图变为可用,并且可以查询off状态下统计的存储资源使用情况。若存在些许误差的情况下,需要矫正用户使用的存储资源,可数据库中执行如下命令,在执行该命令的过程中,如果对表中插入数据,可能会出现统计不够准确的情况: 1 select gs_wlm_readjust_user_space(0); 默认值:on
  • space_readjust_schedule 参数说明:空间管控和空间统计功能中,控制是否触发自动校准以及校准空间误差阈值。该参数8.1.3及以上集群版本支持。 参数类型:SIGHUP 取值范围:字符串 off表示关闭自动校准功能。 auto表示打开自动校准功能,并且触发自动校准的差误阈值为1GB。 auto(空间大小+K/M/G)表示打开自动校准功能,并且触发自动校准的误差阈值为自定义的空间大小KB/MB/GB。例如,auto(200M)表示打开自动校准功能,且触发自动校准的误差阈值为200MB。 默认值:auto
  • default_partition_cache_strategy 参数说明:控制分区缓存的默认策略。该参数8.3.0及以上集群版本支持。 参数类型:USERSET 取值范围:枚举类型 cache_each_partition_as_possible表示尽可能的缓存插入的数据,插入时遇到不同分区的数据并不一定将数据刷入CU。 flush_when_switch_partition表示插入时数据属于不同分区就将数据刷入CU。 默认值:cache_each_partition_as_possible
  • max_active_statements 参数说明:设置全局的最大并发数量。该参数只在CN上应用且针对一个CN上的执行作业。 数据库管理员需根据系统资源(如CPU资源、IO资源和内存资源)情况,调整此数值大小,使得系统支持最大限度的并发作业,且防止并发执行作业过多,引起系统崩溃。 参数类型:SIGHUP 取值范围:整型,-1 ~ INT_MAX。设置为-1和0表示对最大并发数不做限制。 默认值:60
  • max_queue_statements 参数说明:设置最大排队长度。该参数仅8.3.0及以上集群版本支持。 该参数只在CN上应用,针对集群上的所有执行作业,当排队作业超过该参数设置值后,若继续下发作业,系统会报错,提示排队超长。 该参数支持全部排队队列,包含全局并发排队队列、快车道排队队列、慢车道排队队列、CCN全局内存排队队列、CCN资源池排队队列等,每个排队队列单独计数。 参数类型:SIGHUP 取值范围:整型,-1~INT_MAX,设置为-1表示对排队数量不做限制。 默认值:-1
  • cgroup_name 参数说明:设置当前使用的Cgroups的名字或者调整当前group下排队的优先级。 即如果先设置cgroup_name,再设置session_respool,那么session_respool关联的控制组起作用,如果再切换cgroup_name,那么新切换的cgroup_name起作用。 切换cgroup_name的过程中如果指定到Workload控制组级别,数据库不对级别进行验证。级别的范围只要在1-10范围内都可以。 参数类型:USERSET 建议尽量不要混合使用cgroup_name和session_respool。 取值范围:字符串 默认值:DefaultClass:Medium DefaultClass:Medium表示DefaultClass下Timeshare控制组中的Medium控制组。
  • enable_resource_record 参数说明:设置是否开启资源监控记录归档功能。开启时,对于执行结束的记录,会分别被归档到相应的INFO视图(GS_WLM_SESSION_INFO和GS_WLM_OPERAROR_INFO)。此参数需在CN和DN同时应用。 参数类型:SIGHUP 取值范围:布尔型 on表示开启资源监控记录归档功能。 off表示关闭资源监控记录归档功能。 默认值:on 新建集群默认值为on,升级场景该参数的默认值为保持前向兼容维持原值。
  • enable_track_record_subsql 参数说明:设置是否开启子语句记录归档功能。开启时,存储过程、匿名块内部的子语句会被记录归档到相应的INFO表(GS_WLM_SESSION_INFO)。此参数为会话级参数,可在与CN的连接会话中设置生效,仅影响该会话连接中的语句;也可在CN和DN上同时设置,能全局生效。 参数类型:USERSET 取值范围:布尔型 on表示开启子语句资源监控记录归档功能。 off表示关闭子语句资源监控记录归档功能。 默认值:on
  • block_rule_cost 参数说明:设置查询过滤器触发的最小代价。该参数仅9.1.0.200及以上集群版本支持。 参数类型:USERSET 取值范围:整型,-1~INT_MAX 值为-1时,表示不根据cost判断是否对语句进行拦截,对所有语句进行查询过滤。 值为0时,表示对所有cost大于0的语句进行拦截,但特殊类型语句(cost为0)不进行语句拦截。 值大于0时,如果语句cost小于block_rule_cost值,则不进行拦截;否则,对语句进行拦截。 默认值:-1
  • GS_WLM_OPERATOR_STATIS TICS GS_WLM_OPERATOR_STATISTI CS 视图显示当前用户正在执行的作业的算子相关信息。 表1 GS_WLM_OPERATOR_STATISTICS的字段 名称 类型 描述 queryid bigint 语句执行使用的内部query_id。 pid bigint 后端线程ID。 plan_node_id integer 查询对应的执行计划的plan node id。 plan_node_name text 对应于plan_node_id的算子的名称,算子名称长度最大为127字符(不包含空格等格式化字符)。 start_time timestamp with time zone 该算子第一次开始执行的时间。 duration bigint 该算子从开始执行直到结束时总的执行时间(ms)。 status text 当前算子的执行状态,包括waiting、running和finished。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息,若返回的预估行数超过int64_max时,显示为int64_max。 tuple_processed bigint 当前算子在所有DN上的返回的元素个数总和,若返回的预估行数超过int64_max时,显示为int64_max。 min_peak_memory integer 当前算子在所有DN上的最小内存峰值(MB)。 max_peak_memory integer 当前算子在所有DN上的最大内存峰值(MB)。 average_peak_memory integer 当前算子在所有DN上的平均内存峰值(MB)。 memory_skew_percent integer 当前算子在各DN间的内存使用倾斜率。 min_spill_size integer 若发生下盘,所有下盘DN的最小逻辑下盘数据量(MB),默认为0。 max_spill_size integer 若发生下盘,所有下盘DN的最大逻辑下盘数据量(MB),默认为0。 average_spill_size integer 若发生下盘,所有下盘DN的平均逻辑下盘数据量(MB),默认为0。 spill_skew_percent integer 若发生下盘,DN间下盘倾斜率。 min_cpu_time bigint 该算子在所有DN上的最小执行时间(ms)。 max_cpu_time bigint 该算子在所有DN上的最大执行时间(ms)。 total_cpu_time bigint 该算子在所有DN上的总执行时间(ms)。 cpu_skew_percent integer DN间执行时间的倾斜率。 warning text 主要显示如下几类告警信息: Sort/SetOp/HashAgg/HashJoin spill Spill file size large than 256MB Broadcast size large than 100MB Early spill Spill times is greater than 3 Spill on memory adaptive Hash table conflict parent_id integer 该算子节点的父节点id。 exec_count integer 该算子节点在所有DN上的最大执行次数。 progress text 该算子的进度信息,第一个算子展示的是作业整体的进度。其他算子展示的是当前算子进度信息。 min_net_size bigint 该算子在所有DN上的最小网络通信数据量(KB),主要涉及网络算子。 max_net_size bigint 该算子在所有DN上的最大网络通信数据量(KB),主要涉及网络算子。 total_net_size bigint 该算子在所有DN上的总网络通信数据量(KB),主要涉及网络算子。 min_read_bytes bigint 该算子在所有DN上的最小磁盘读取数据量(KB)。 max_read_bytes bigint 该算子在所有DN上的最大磁盘读取数据量(KB)。 total_read_bytes bigint 该算子在所有DN上的总磁盘读取数据量(KB)。 min_write_bytes bigint 该算子在所有DN上的最小磁盘写入数据量(KB)。 max_write_bytes bigint 该算子在所有DN上的最大磁盘写入数据量(KB)。 total_write_bytes bigint 该算子在所有DN上的总磁盘写入数据量(KB)。 父主题: 系统视图
  • 参数说明 block_name表示语句块的block_name,详细说明请参考block_name。 table表示为该子链接块hint的别名的名称。 表的语法格式如下: [schema.]table[@block_name] 表名可以带schema,也可以带所在子查询语句块提升前的block_name。子查询语句块在优化器进行优化重写的发生提升,则该block_name会与leading中block_name不同。 表如果存在别名,优先使用别名来表示该表。
  • 注意事项 block_name hint仅在对应的子链接块提升时才会被上层查询使用。目前支持的子链接提升包括IN子链接提升、EXISTS子链接提升和包含Agg等值相关子链接提升。该hint通常会和前面章节提到的hint联合使用。 对于FROM关键字后的子查询,则需要使用子查询的别名进行hint,block_name hint不会被用到。 如果子链接中含有多个表,则提升后这些表可与外层表以任意优化顺序连接,hint也不会被用到。
  • PG_NAMESPACE PG_NAMESPACE系统表存储命名空间,即存储schema相关的信息。 表1 PG_NAMESPACE字段 名称 类型 描述 nspname name 命名空间的名称。 nspowner oid 命名空间的所有者。 nsptimeline bigint 在DN上创建此命名空间时的时间线。此字段为内部使用,仅在DN上有效。 nspacl aclitem[] 访问权限。具体请参见GRANT和REVOKE。 permspace bigint schema永久表空间限额。 usedspace bigint schema已用永久表空间大小。 父主题: 系统表
  • 应用示例 使用PGXC_BULKLOAD_INFO视图查询互联互通导入业务: SELECT * FROM PGXC_BULKLOAD_INFO; datid | dbname | schemaname | nodename | username | application_name | client_addr | client_hostname | client_port | query_band | block_time | start_time | finish_time | statu s | queryid | query | session_id | address | direction | min_done_lines | max_done_lines | total_done_lines | min_done_by tes | max_done_bytes | total_done_bytes -------+----------+----------------+--------------+----------------+------------------+-------------+-----------------+-------------+------------+------------+-------------------------------+-------------------------------+------- ---+-------------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------+-----------------------------------------+-------------------+---------------+----------------+----------------+------------------+------------ ----+----------------+------------------ 16134 | postgres | "$user",public | coordinator1 | interconn_user | gsql | | | -1 | | 0 | 2023-09-25 10:27:47.184696+08 | 2023-09-25 10:27:48.709665+08 | finish ed | 72339069014639035 | INSERT INTO interconn_user.lineitem_dest SELECT * FROM interconn_user.ft_lineitem_local; | 1695608841.140482657154648.coordinator1 | 10.90.45.56:63755 | gds from pipe | 19479 | 20971 | 60175 | 3251258 | 3500876 | 10038234 16134 | postgres | "$user",public | coordinator1 | interconn_user | interconnection | 10.90.45.56 | | 47668 | | 0 | 2023-09-25 10:27:47.256095+08 | 2023-09-25 10:27:48.582366+08 | finish ed | 72339069014639046 | INSERT INTO pg_temp.ft_lineitem_local_72339069014639035_wo SELECT l_orderkey, l_partkey, l_suppkey, l_linenumber, l_quantity, l_extendedprice, l_discount, l_tax, l_returnflag, l_linestatus, l_shipdate, l_c ommitdate, l_receiptdate, l_shipinstruct, l_shipmode, l_comment FROM public.lineitem; | 1695608867.140482657156768.coordinator1 | 10.90.45.56 | gds to pipe | 19476 | 20934 | 60175 | 3249308 | 3489789 | 10038234 (2 rows)
  • GS_BLOCKLIST_QUERY GS_BLOCKLIST_QUERY系统表存储作业黑名单信息和异常信息,该表以unique_sql_id作为唯一索引,进行作业异常信息统计和黑名单记录,可通过与GS_WLM_SESSION_INFO进行关联获取作业的query字段和执行信息。 GaussDB (DWS)同时提供了GS_BLOCKLIST_QUERY视图用于查询作业黑名单和异常信息,该视图可直接显示query字段信息,不过因为该视图与GS_WLM_SESSION_INFO为依赖关系,因此在GS_WLM_SESSION_INFO表较大的情况下,查询可能需要消耗较长的时间。 表1 GS_BLOCKLIST_QUERY字段 名字 类型 引用 描述 unique_sql_id bigint - 基于查询解析树生成的查询ID。 block_list boolean - 查询作业是否属于黑名单。 except_num integer - 查询作业异常次数。 except_time timestamp - 查询作业最近一次异常时间。 此系统表的schema为dbms_om。 此系统表包含唯一索引,使用哈希分布方式分布在DN上,分布列为unique_sql_id。 此系统表仅限在gaussdb数据库中查询,其它数据库中查询会直接报错。 GS_BLOCKLIST_QUERY视图存储在pg_catalog下。 通常对于DML语句,在计算Unique SQL ID的过程中会忽略常量值。但对于DDL、DCL以及设置参数等语句,常量值不可以忽略。因此一个unique_sql_id可能会对应一个或多个查询。 父主题: 系统表
  • 规则1.5 应用侧使用连接池场景,如使用连接SET设置过参数,当将连接归还连接池前,必须进行参数重置 违反规则的影响: 连接被其他业务复用时,可能会应复用其他业务设置的参数出现业务性能、业务报错等问题。 方案建议: 在将连接归还连接池之前,使用“SET SESSION AUTHORIZATION DEFAULT;RESET ALL;”重置参数。 注意: 在应用侧使用连接池的场景,如果在DWS服务侧通过GS_GUC RELOAD设置了全局的GUC参数,需要重启应用侧连接池该参数才可以生效,因为该设置只针对新建的连接生效,针对连接池中原有的连接不生效。
  • 规则1.3 开启的事务最后必须提交或回滚 违反规则的影响: 事务长时间不提交,持锁阻塞ALTER等操作,进而阻塞所有业务。 大量“idle in transaction”连接,触发连接上限,导致新建连接报错。 方案建议: 默认使用autocommit自动提交方式,如关闭autocommit,则必须手动提交。 显式start transaction开启的事务,执行完相关操作后,必须显式commit/rollback结束事务。
  • 参数说明 join_table_list 为表示表join顺序的hint字符串,可以包含当前层的任意个表(别名),或对于子查询提升的场景,也可以包含子查询的hint别名,同时任意表可以使用括号指定优先级,表之间使用空格分隔。 join table list中指定的表需要满足以下要求,否则会报语义错误: list中的表必须在当前层或提升的子查询中存在。 list中的表在当前层或提升的子查询中必须是唯一的。如果不唯一,需要使用不同的别名进行区分。 同一个表只能在list里出现一次。 如果表存在别名,则list中的表需要使用别名。 表的语法格式如下: [schema.]table[@block_name] 表名可以带schema,也可以带所在子查询语句块提升前的block_name。子查询语句块在优化器进行优化重写的发生提升,则该block_name会与leading中block_name不同。 表如果存在别名,优先使用别名来表示该表。
  • 语法格式 单层圆括号(),仅指定join顺序,不指定内外表顺序。 1 2 leading(join_table_list) leading(@block_name join_table_list) 双层圆括号(()),同时指定join顺序和内外表顺序,内外表顺序仅在最外层生效。 1 2 leading((join_table_list)) leading(@block_name (join_table_list))
  • transform_null_equals 参数说明:控制表达式expr = NULL(或NULL = expr)当做expr IS NULL处理。如果expr得出NULL值则返回真,否则返回假。 正确的SQL标准兼容的expr = NULL总是返回NULL(未知)。 Microsoft Access里的过滤表单生成的查询使用expr = NULL来测试空值。打开这个选项,可以使用该接口来访问数据库。 参数类型:USERSET 取值范围:布尔型 on表示控制表达式expr = NULL(或NULL = expr)当做expr IS NULL处理。 off表示不控制,即expr = NULL总是返回NULL(未知)。 默认值:off 新用户经常在涉及NULL的表达式上语义混淆,故默认值设为off。
  • td_compatible_truncation 参数说明:控制是否开启与Teradata数据库相应兼容的特征。该参数在用户连接上与TD兼容的数据库时,可以将参数设置成为on(即超长字符串自动截断功能启用),该功能启用后,在后续的insert语句中,对目标表中char和varchar类型的列插入超长字符串时,会按照目标表中相应列定义的最大长度对超长字符串进行自动截断。保证数据都能插入目标表中,而不是报错。 超长字符串自动截断功能不适用于insert语句包含外表的场景。 如果向字符集为字节类型编码(SQL_ASCII,LATIN1等)的数据库中插入多字节字符数据(如汉字等),且字符数据跨越截断位置,这种情况下,按照字节长度自动截断,自动截断后会在尾部产生非预期结果。如果用户有对于截断结果正确性的要求,建议用户采用UTF8等能够按照字符截断的输入字符集作为数据库的编码集。 参数类型:USERSET 取值范围:布尔型 on表示启动超长字符串自动截断功能。 off表示停止超长字符串自动截断功能。 默认值:off
  • max_files_per_node 参数说明:限制单个节点上单个SQL打开的文件最大数量。通常情况下,不需要设置此参数。该参数仅8.1.3及以上集群版本支持。 参数类型:SUSET 取值范围:整型,-1~INT_MAX,其中-1表示限制最大数量。 默认值:-1 新装集群中该参数的默认值为-1,升级场景该参数的默认值为保持前向兼容维持原值。 执行语句报错“The last file name is [%s] and %d files have already been opened on data node [%s] with a maximum of %d files.”时,请尝试增大max_files_per_node值。
  • GS_BLOCKLIST_SQL GS_BLOCKLIST_SQL系统表存储作业黑名单信息和异常信息,该表以sql_hash作为唯一索引,进行作业异常信息统计和黑名单记录,可通过与GS_WLM_SESSION_INFO进行关联获取作业的query字段和执行信息。 GaussDB(DWS)同时提供了GS_BLOCKLIST_SQL视图用于查询作业黑名单和异常信息,该视图可直接显示query字段信息,不过因为该视图与GS_WLM_SESSION_INFO为依赖关系,因此在GS_WLM_SESSION_INFO表较大的情况下,查询可能需要消耗较长的时间。 该系统表仅9.1.0.200及以上集群版本支持。 表1 GS_BLOCKLIST_SQL字段 名字 类型 引用 描述 sql_hash text - 基于查询解析树生成的sql_hash。 block_list boolean - 查询作业是否属于黑名单。 except_num integer - 查询作业异常次数。 except_time timestamp - 查询作业最近一次异常时间。 此系统表的schema为dbms_om。 此系统表包含唯一索引,使用哈希分布方式分布在DN上,分布列为sql_hash。 此系统表仅限在gaussdb数据库中查询,其它数据库中查询会直接报错。 GS_BLOCKLIST_SQL视图存储在pg_catalog下。 通常对于DML语句,在计算sql_hash的过程中会忽略常量值。但对于DDL、DCL以及设置参数等语句,常量值不可以忽略。因此一个sql_hash可能会对应一个或多个查询。 父主题: 系统表
  • PGXC_WLM_OPERATOR_INFO PGXC_WLM_OPERATOR_INFO视图显示在所有CN上执行作业结束时的算子信息。此视图的数据直接从系统表GS_WLM_OPERATOR_INFO获取。 需要有系统管理员权限或预置角色gs_role_read_all_stats权限才可以访问此视图。具体的字段请参考表1。 表1 GS_WLM_OPERATOR_INFO的字段 名称 类型 描述 nodename text 执行语句的CN实例名称。 queryid bigint 语句执行使用的内部query_id。 pid bigint 后端线程ID。 plan_node_id integer 查询对应的执行计划的plan node id。 plan_node_name text 对应于plan_node_id的算子的名称。 start_time timestamp with time zone 该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间(ms)。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。 min_peak_memory integer 当前算子在所有DN上的最小内存峰值(MB)。 max_peak_memory integer 当前算子在所有DN上的最大内存峰值(MB)。 average_peak_memory integer 当前算子在所有DN上的平均内存峰值(MB)。 memory_skew_percent integer 当前算子在各DN间的内存使用倾斜率。 min_spill_size integer 若发生下盘,所有下盘DN的最小下盘数据量(MB),默认为0。 max_spill_size integer 若发生下盘,所有下盘DN的最大下盘数据量(MB),默认为0。 average_spill_size integer 若发生下盘,所有下盘DN的平均下盘数据量(MB),默认为0。 spill_skew_percent integer 若发生下盘,DN间下盘倾斜率。 min_cpu_time bigint 该算子在所有DN上的最小执行时间(ms)。 max_cpu_time bigint 该算子在所有DN上的最大执行时间(ms)。 total_cpu_time bigint 该算子在所有DN上的总执行时间(ms)。 cpu_skew_percent integer DN间执行时间的倾斜率。 warning text 主要显示如下几类告警信息: Sort/SetOp/HashAgg/HashJoin spill Spill file size large than 256MB Broadcast size large than 100MB Early spill Spill times is greater than 3 Spill on memory adaptive Hash table conflict 父主题: 系统视图
  • GS_WLM_OPERATOR_INFO GS_WLM_OPERATOR_INFO系统表显示执行作业结束后的算子相关的记录。此数据是从内核中转储到系统表中的数据。当设置GUC参数enable_resource_record为on时,系统会定时将GS_WLM_OPERATOR_HISTORY中的记录导入此系统表,开启此功能会占用系统存储空间并对性能有一定影响,不建议用户使用。 此系统表的schema是dbms_om。 pg_catalog下存在GS_WLM_OPERATOR_INFO视图。 表1 GS_WLM_OPERATOR_INFO的字段 名称 类型 描述 nodename text 执行语句的CN实例名称。 queryid bigint 语句执行使用的内部query_id。 pid bigint 后端线程ID。 plan_node_id integer 查询对应的执行计划的plan node id。 plan_node_name text 对应于plan_node_id的算子的名称。 start_time timestamp with time zone 该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间(ms)。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。 min_peak_memory integer 当前算子在所有DN上的最小内存峰值(MB)。 max_peak_memory integer 当前算子在所有DN上的最大内存峰值(MB)。 average_peak_memory integer 当前算子在所有DN上的平均内存峰值(MB)。 memory_skew_percent integer 当前算子在各DN间的内存使用倾斜率。 min_spill_size integer 若发生下盘,所有下盘DN的最小下盘数据量(MB),默认为0。 max_spill_size integer 若发生下盘,所有下盘DN的最大下盘数据量(MB),默认为0。 average_spill_size integer 若发生下盘,所有下盘DN的平均下盘数据量(MB),默认为0。 spill_skew_percent integer 若发生下盘,DN间下盘倾斜率。 min_cpu_time bigint 该算子在所有DN上的最小执行时间(ms)。 max_cpu_time bigint 该算子在所有DN上的最大执行时间(ms)。 total_cpu_time bigint 该算子在所有DN上的总执行时间(ms)。 cpu_skew_percent integer DN间执行时间的倾斜率。 warning text 主要显示如下几类告警信息: Sort/SetOp/HashAgg/HashJoin spill Spill file size large than 256MB Broadcast size large than 100MB Early spill Spill times is greater than 3 Spill on memory adaptive Hash table conflict 父主题: 系统表
共100000条