华为云用户手册

数据仓库服务 GAUSSDB(DWS)-统计信息函数:pg_user_iostat(text)

pg_user_iostat(text) 描述：该函数8.1.2版本中已废弃，当前版本查询无效。8.2.0及以上集群版本中可使用PGXC_TOTAL_USER_RESOURCE_INFO视图查询实例上用户实时资源消耗信息。返回值类型：record 名称类型描述 userid oid 用户ID。 min_curr_iops int4 当前该用户io在各DN中的最小值。 max_curr_iops int4 当前该用户io在各DN中的最大值。 min_peak_iops int4 该用户io峰值中，各DN的最小值。 max_peak_iops int4 该用户io峰值中，各DN的最大值。 io_limits int4 用户指定的资源池所设置的io_limits。 io_priority text 该用户所设io_priority。

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:gs_control_group_info(pool text)

gs_control_group_info(pool text) 描述：查看资源池关联的控制组信息返回值类型：record 返回信息如下：属性属性值描述 name class_a:workload_a1 class和workload名称。 class class_a Class控制组名称。 workload workload_a1 Workload控制组名称。 type DEFWD 控制组类型（Top、CLASS、BAKWD、DEFWD、TSWD）。 gid 87 控制组ID。 shares 30 占父节点CPU资源的百分比。 limits 0 占父节点CPU核数的百分比。 rate 0 Timeshare中的分配比例。 cpucores 0-3 CPU核心数。

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pgxc_stat_flush_object_data()

pgxc_stat_flush_object_data() 描述：手动执行持久化，每个节点将本地所有库中的所有表的统计信息写入pg_stat_object系统表。统计信息包括pg_stat_object中从databaseid到autovac_vacuum_count共29个字段。只有系统管理员可以执行此函数。9.1.0.100及以上集群版本支持。返回值类型：boolean 示例：系统管理员用户执行持久化。 1 2 3 4 5 SELECT pgxc_stat_flush_object_data(); pgxc_stat_flush_object_data ----------------------------- t (1 row) 此函数不支持并发执行。

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pgxc_get_wlm_current_instance_info(text, int default null)

pgxc_get_wlm_current_instance_info(text, int default null) 描述：在CN节点上查询集群各节点当前的资源使用情况，读取内存中还未存到GS_WLM_INSTANCE_HISTORY系统表的数据。入参分别为：节点名称(可以输入ALL、C、D、实例名称)，每个节点返回的最大数量。返回值为GS_WLM_INSTANCE_HISTORY。返回值类型：setof record

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pgxc_get_wlm_history_instance_info(text, TIMESTAMP, TIMESTAMP, int default null)

pgxc_get_wlm_history_instance_info(text, TIMESTAMP, TIMESTAMP, int default null) 描述：在CN节点上查询集群各节点历史资源使用情况，读取GS_WLM_INSTANCE_HISTORY系统表的数据。入参分别为：节点名称(可以输入ALL、C、D、实例名称)，起始区间时间，结束区间时间，每个实例返回的最大数量。返回值为GS_WLM_INSTANCE_HISTORY。返回值类型：setof record

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:gs_all_nodegroup_control_group_info(text)

gs_all_nodegroup_control_group_info(text) 描述：提供了所有逻辑集群的控制组信息。该函数在调用的时候需要指定要查询逻辑集群的名称。例如要查询'installation'逻辑集群的控制组信息： 1 SELECT * FROM gs_all_nodegroup_control_group_info('installation'); 返回值类型：record 函数返回字段如下：名称类型描述 name text 控制组的名称。 type text 控制组的类型。 gid bigint 控制组ID。 classgid bigint Workload所属Class的控制组ID。 class text Class控制组。 workload text Workload控制组。 shares bigint 控制组分配的CPU资源配额。 limits bigint 控制组分配的CPU资源限额。 wdlevel bigint Workload控制组层级。 cpucores text 控制组使用的CPU核的信息。

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pgxc_stat_get_all(relnamespace text, relname text)

pgxc_stat_get_all(relnamespace text, relname text) 描述：返回表在所有CN上pg_stat_object中对应的tuple记录，包括从databaseid到autovac_vacuum_count共29个字段。8.3.0及以上集群版本支持。返回值类型：setof record 示例：查询所有CN上public模式下t1表的最近一次访问时间。 1 2 3 4 5 6 7 SELECT relid,data_access_timestamp FROM pgxc_stat_get_all('public','t1'); relid | data_access_timestamp -----------+------------------------------- 2147516676 | 2000-01-01 08:00:00+08 2147516674 | 2000-01-01 08:00:00+08 2147516655 | 2024-06-27 16:16:26.643132+08 (3 rows)

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pgxc_stat_get_last_data_access_timestamp(relnamespace text, relname text)

pgxc_stat_get_last_data_access_timestamp(relnamespace text, relname text) 描述：返回指定表在所有节点中最近一次的访问时间。9.1.0.100及以上集群版本支持。返回值类型：timestamptz 示例：查询所有节点上public模式下t1表的最近一次访问时间。 1 2 3 4 5 SELECT * FROM pgxc_stat_get_last_data_access_timestamp('public','t1'); pgxc_stat_get_last_data_access_timestamp ------------------------------------------ 2024-06-27 16:16:26.643132+08 (1 row)

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pgxc_stat_single_table(schema, tablename)

pgxc_stat_single_table(schema, tablename) 描述：在CN上执行，入参为schema和表名。查询单张表在全库中的统计信息及该表在每个DN上的脏页率。该函数仅8.1.3及以上集群版本支持。该函数的统计信息依赖于ANALYZE，为获取该表最准确的信息请先对表进行ANALYZE。返回值类型：record 返回值字段与函数pg_stat_get_tuple()相同。 1 2 3 4 5 6 7 8 SELECT * FROM pgxc_stat_single_table('public','t1'); nodename | tableid | partid | last_vacuum | last_autovacuum | last_analyze | last_autoanalyze | vacuum_count | autovacuum_count | analyze_count | autoanalyze_count | n_tup_ins | n_ tup_upd | n_tup_del | n_tup_hot_upd | n_tup_change | n_live_tup | n_dead_tup | dirty_rate | last_data_changed -----------+---------+--------+------------------------+------------------------+-------------------------------+------------------------+--------------+------------------+---------------+-------------------+-----------+--- --------+-----------+---------------+--------------+------------+------------+------------+------------------- datanode1 | 1270075 | | 2000-01-01 08:00:00+08 | 2000-01-01 08:00:00+08 | 2023-01-09 09:38:43.220876+08 | 2000-01-01 08:00:00+08 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | (1 row)

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pg_stat_get_all(regclass)

pg_stat_get_all(regclass) 描述：返回表在当前CN上pg_stat_object中对应的tuple记录，包括从databaseid到autovac_vacuum_count共29个字段。入参为表的oid。8.3.0及以上集群版本支持。返回值类型：setof record 示例：查询当前节点public模式下t1表的最近一次访问时间。 1 2 3 4 5 SELECT data_access_timestamp FROM pg_stat_get_all('public.t1'::regclass); data_access_timestamp ------------------------------- 2024-06-27 16:16:26.643132+08 (1 row)

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pg_stat_get_local_analyze_status(oid)

pg_stat_get_local_analyze_status(oid) 描述：指定表在当前节点上的是否需要analyze的状态，仅在CN端有意义。该函数仅8.1.2及以上版本支持。如果该表的修改行数超过analyze的阈值（根据autovacuum_analyze_threshold + autovacuum_analyze_scale_factor * reltuples计算，其中reltuples是pg_class中记录的表的估算行数），则返回“Analyze needed”。如果该表的修改行数不超过analyze的阈值，则返回“Analyze not needed”。返回值类型：text

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-统计信息函数:pg_stat_get_tuple()

pg_stat_get_tuple() 描述：在CN和DN上均可以执行，该函数仅8.1.3及以上集群版本支持。函数无参时，查询CN上所有系统表的统计信息及表在每个CN上的脏页率，查询DN上所有系统表和用户表的统计信息和表在每个DN上的脏页率；函数带入参时，入参是schema和表名，带入参的函数执行时查询单张表的统计信息和脏页率。该函数的统计信息依赖于ANALYZE，为获取最准确的信息请先对表进行ANALYZE。返回值类型：record 函数返回字段如下：名称类型描述 nodename text 节点名。 tableid oid 表的OID。 partid oid 分区表的分区OID。 last_vacuum timestamp with time zone 最后一次手动vacuum时间。 last_autovacuum timestamp with time zone 最后一次autovacuum时间。 last_analyze timestamp with time zone 最后一次手动analyze时间。 last_autoanalyze timestamp with time zone 最后一次autoanalyze时间。 vacuum_count bigint vacuum次数。 autovacuum_count bigint autovacuum次数。 analyze_count bigint analyze次数。 autoanalyze_count bigint autoanalyze_count次数。 n_tup_ins bigint 插入的行数。 n_tup_upd bigint 更新的行数。 n_tup_del bigint 删除的行数。 n_tup_hot_upd bigint HOT更新的行数。 n_tup_change bigint analyze之后改变的行数。 n_live_tup bigint live行估计数。 n_dead_tup bigint dead行估计数。 dirty_rate bigint 单节点的脏页率（单CN或单DN级）。 last_data_changed timestamp with time zone 记录表最后一次数据变化的时间。

数据仓库服务 GAUSSDB(DWS) 函数和操作符
数据仓库服务 GAUSSDB(DWS)-Snowball词典

Snowball词典 Snowball词典模板支持词干分析词典，基于Martin Porter的Snowball项目，内置有许多语言的词干分析算法。 GaussDB (DWS)中预定义有多种语言的Snowball词典，可通过系统表PG_TS_DICT查看预定义的词干分析词典以及支持的语言词干分析算法。无论是否可以简化，Snowball词典将标示所有输入为已识别，因此它应当被放置在词典列表的最后。把Snowball词典放在任何其他词典前面会导致后继词典失效，因为输入token不会通过Snowball词典进入到下一个词典。关于Snowball词典的语法，请参见CREATE TEXT SEARCH DICTIONARY。父主题：词典

数据仓库服务 GAUSSDB(DWS) 词典
数据仓库服务 GAUSSDB(DWS)-CREATE EXTERNAL SCHEMA:示例

示例通过external schema读取Lakeformation表。创建lf_server，对应的foreign data wrapper为DFS_FDW。如何创建lf_server请参见《用户指南》中“管理LakeFormation数据源”章节。创建external schema，SOURCE填写lakeformation，表关联的 DLI 服务器为lf_server。其中DATABASE为对应的Lakeformation数据库，CATA LOG 为对应要访问的Lakeformation的CATALOG，根据实际替换。 1 2 3 4 5 CREATE EXTERNAL SCHEMA ex_lf WITH SOURCE lakeformation DATABASE 'demo' SERVER lf_server CATALOG 'hive'; 角色授权查询当前用户。 SELECT current_user; Lakeformation管控面创建与当前同名角色并对要访问的表授权。通过external schema查询Lakeformation表的数据，test_lf为要访问的Lakeformation表。 1 2 3 4 5 SELECT COUNT(*) FROM ex_dli.test_lf; count ------- 20 (1 row)

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-CREATE EXTERNAL SCHEMA:参数说明

参数说明 schema_name 外部模式名字。取值范围：字符串，要符合标识符的命名规范。模式名不能和当前数据库里其他的模式重名。模式的名字不可以“pg_”开头。 SOURCE 外部元数据存储引擎的类型，当前source_type仅支持dli，lakeformation。 DATABASE 指定外部SCHEMA所对应的要访问的数据库。 SERVER 取值范围：已存在的foreign server且type类型为lf或dli。通过external schema关联foreign server以达到访问外部数据的目的。 CATALOG Lakeformation中对应的要访问的catalog，当server type为lf时需要指定catalog，否则不需要指定。 OPTIONS 用于指定外表数据的各类参数，参数类型如下所示。该参数仅8.3.0及以上版本支持。 dli_project_id DLI服务对应的项目编号，可在管理控制台上获取项目ID，该参数仅支持server类型为DLI时设置。 METAADDRESS 表示hivemetastore通讯接口。该参数仅9.1.0及以上版本支持。 CONFIGURATION 表示hivemetastore相关配置文件存放路径。该参数仅9.1.0及以上版本支持。如果当前搜索路径上的模式中存在同名对象时，需要明确指定引用对象所在的模式。可以通过命令SHOW SEARCH_PATH来查看当前搜索路径上的模式。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-CREATE EXTERNAL SCHEMA:语法格式

语法格式根据指定的名字创建EXTERNAL SCHEMA。 1 2 3 4 5 6 7 8 CREATE EXTERNAL SCHEMA schema_name WITH SOURCE source_name DATABASE 'database_name' SERVER server_name [ CATALOG 'catalog_name' ] [ OPTIONS ( { option_name ' value ' } [, ...] ) ] [METAADDRESS 'address'] [CONFIGURATION 'confpath'];

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-ALTER TABLE:参数说明

参数说明 IF EXISTS 如果不存在相同名称的表，不会抛出一个错误，而会发出一个通知，告知表不存在。 table_name [*] | ONLY table_name | ONLY ( table_name ) table_name是需要修改的表名。若声明了ONLY选项，则只有那个表被更改。若未声明ONLY，该表及其所有子表都将会被更改。另外，可以在表名称后面显示地增加*选项来指定包括子表，即表示所有后代表都被扫描，这是默认行为。 constraint_name 约束的名字。约束名长度不超过63个字符。 index_name 索引名称。 storage_parameter 表的存储参数的名字。分区管理新增的两个选项： PERIOD（interval类型）设置分区管理中自动创建分区的周期。 PERIOD的范围要求以及开启该功能的约束请参考▪PERIOD。在建表时，如果没有设置该参数，可以通过set的方式添加该参数，并开启自动创建分区功能；如果之前已经设置该参数，则通过set的方式修改该参数。用户可以通过reset该参数的方式关闭自动创建分区功能，但是在自动删除分区功能存在的情况下，不支持关闭自动创建分区功能。 TTL（interval类型）设置分区管理中自动删除分区的分区过期时间。 TTL的范围要求以及开启该功能的约束请参考▪TTL。在建表时，如果没有设置该参数，可以通过set的方式添加该参数，并开启自动删除分区功能；如果之前已经设置该参数，则通过set的方式修改该参数。用户可以通过reset该参数的方式关闭自动删除分区功能。 turbo存储格式列存表新增的选项： enable_turbo_store 设置列存表是否为turbo存储格式。该选项仅9.1.0.100及以上集群版本支持。 3.0普通列存表不支持设置turbo存储格式，3.0 hstore_opt表仅支持turbo存储格式。 2.0版本列存表无限制。 new_owner 表所属新的拥有者的名字。 new_tablespace 表所属新的表空间名字。 column_name，column_1_name， column_2_name 现存的或新字段的名称。 data_type 新字段的类型，或者现存字段的新类型。 compress_mode 表字段的压缩可选项，当前仅对行存表有效。该子句指定该字段优先使用的压缩算法。 collation 字段排序规则名称。可选字段COLLATE指定了新字段的排序规则，如果省略，排序规则为新字段的默认类型。 USING expression USING子句声明如何从旧的字段值里计算新的字段值；如果省略，缺省从旧类型向新类型的赋值转换。如果从旧数据类型到新类型没有隐含或者赋值的转换，则必须提供一个USING子句。 ALTER TYPE的USING选项实际上可以声明涉及该行旧值的任何表达式，即它可以引用除了正在被转换的字段之外其他的字段。这样，就可以用ALTER TYPE语法做非常普遍性的转换。因为这个灵活性，USING表达式并没有作用于该字段的缺省值（如果有的话），结果可能不是缺省表达式要求的常量表达式。这就意味着如果从旧类型到新类型没有隐含或者赋值转换的话，即使存在USING子句，ALTER TYPE也可能无法把缺省值转换成新的类型。在这种情况下，应该用DROP DEFAULT先删除缺省，执行ALTER TYPE，然后使用SET DEFAULT增加一个合适的新缺省值。类似的考虑也适用于涉及该字段的索引和约束。 NOT NULL | NULL 设置列是否允许空值。 integer 带符号的整数常值。当使用PERCENT时表示按照表数据的百分比收集统计信息，integer的取值范围为0-100。 attribute_option 属性选项。 PLAIN | EXTERNAL | EXTENDED | MAIN 字段存储模式。 PLAIN必须用于定长的数值（比如integer）并且是内联的、不压缩的。 MAIN用于内联、可压缩的数据。 EXTERNAL用于外部保存、不压缩的数据。使用EXTERNAL将令在text和bytea字段上的子字符串操作更快，但付出的代价是增加了存储空间。 EXTENDED用于外部的压缩数据，EXTENDED是大多数支持非PLAIN存储的数据的缺省。 CHECK ( expression ) 每次将要插入的新行或者将要被更新的行必须使表达式结果为真才能成功，否则会抛出一个异常并且不会修改数据库。声明为字段约束的检查约束应该只引用该字段的数值，而在表约束里出现的表达式可以引用多个字段。目前，CHECK表达式不能包含子查询也不能引用除当前行字段之外的变量。 DEFAULT default_expr 给字段指定缺省值。缺省表达式的数据类型必须和字段类型匹配。缺省表达式将被用于任何未声明该字段数值的插入操作。如果没有指定缺省值则缺省值为NULL 。 default_expr中若使用后缀操作符（如!），需使用括号括起来。 UNIQUE [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] index_parameters UNIQUE ( column_name [, ... ] ) [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] index_parameters UNIQUE约束表示表里的一个或多个字段的组合必须在全表范围内唯一。其中[ NULLS [ NOT ] DISTINCT | NULLS IGNORE ]字段用来指定Unique唯一索引中索引列NULL值的处理方式。默认取值：该参数默认取值为空，即NULL值可重复插入。在对插入的新数据和表中原始数据进行列的等值比较时，对于NULL值有以下三种处理方式： NULLS DISTINCT：NULL值互不相等，即NULL值可重复插入。 NULLS NOT DISTINCT：NULL值相等。若索引列全为NULL，则NULL值不可重复插入；部分索引列为NULL，只有非NULL值不相等，才可成功插入数据。 NULLS IGNORE：在等值比较时跳过NULL值。若索引列全为NULL，则NULL值可重复插入；部分索引列为NULL，只有非NULL值不相等，才可成功插入数据。三种处理方式具体的行为如下表所示：表1 唯一索引中索引列NULL值的处理方式字段控制索引列全为NULL 部分索引列为NULL NULLS DISTINCT 可重复插入可重复插入 NULLS NOT DISTINCT 不可重复插入非NULL值相等，不可插入；非NULL值不相等，则插入成功 NULLS IGNORE 可重复插入非NULL值相等，不可插入；非NULL值不相等，则插入成功 PRIMARY KEY index_parameters PRIMARY KEY ( column_name [, ... ] ) index_parameters 主键约束表明表中的一个或者一些字段只能包含唯一（不重复）的非NULL值。 DEFERRABLE | NOT DEFERRABLE | INITIALLY DEFERRED | INITIALLY IMMEDIATE 设置该约束是否可推迟，列存暂不支持。 DEFERRABLE：可以推迟到事务结尾使用SET CONSTRAINTS命令检查。 NOT DEFERRABLE：在每条命令之后马上检查。 INITIALLY IMMEDIATE：那么每条语句之后就立即检查它。 INITIALLY DEFERRED：只有在事务结尾才检查它。 WITH ( {storage_parameter = value} [, ... ] ) 为表或索引指定一个可选的存储参数。 COMPRESS|NOCOMPRESS NOCOMPRESS：如果指定关键字NOCOMPRESS则不会修改表的现有压缩特性。 COMPRESS：如果指定COMPRESS关键字，则对该表进行批量插入元组时触发该特性。 new_table_name 修改后新的表名称。 new_column_name 表中指定列修改后新的列名称。 new_constraint_name 修改后表约束的新名称。 new_schema 修改后新的模式名称。 CASCADE 级联删除依赖于被依赖字段或者约束的对象（比如引用该字段的视图）。 RESTRICT 如果字段或者约束还有任何依赖的对象，则拒绝删除该字段。这是缺省行为。 schema_name 表所在的模式名称。 cache_policy 表缓存策略，仅存算分离3.0版本支持，具体取值参见cache_policy。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-ALTER TABLE:表操作示例

表操作示例重命名表： 1 ALTER TABLE CUSTOMER RENAME TO CUSTOMER_t; 给表增加一个新的约束： 1 ALTER TABLE customer_address ADD PRIMARY KEY(ca_address_sk); 根据已有唯一索引为表增加主键约束或唯一约束。先给表CUSTOMER创建唯一索引CUSTOMER_constraint1，然后根据已有唯一索引增加主键约束，并对前面创建的索引rename： 1 2 CREATE UNIQUE INDEX CUSTOMER_constraint1 ON CUSTOMER(C_CUSTKEY); ALTER TABLE CUSTOMER ADD CONSTRAINT CUSTOMER_constraint2 PRIMARY KEY USING INDEX CUSTOMER_constraint1; 重命名表约束： 1 ALTER TABLE CUSTOMER RENAME CONSTRAINT CUSTOMER_constraint2 TO CUSTOMER_constraint; 删除表约束： 1 ALTER TABLE CUSTOMER DROP CONSTRAINT CUSTOMER_constraint; 给表增加一个索引： 1 ALTER TABLE CUSTOMER ADD INDEX CUSTOMER_index(C_CUSTKEY); 删除表索引： 1 2 ALTER TABLE CUSTOMER DROP INDEX CUSTOMER_index; ALTER TABLE CUSTOMER DROP KEY CUSTOMER_index; 向在一个列存表中添加局部聚簇列： 1 ALTER TABLE customer_address ADD CONSTRAINT customer_address_cluster PARTIAL CLUSTER KEY(ca_address_sk); 删除一个列存表中的局部聚簇列： 1 ALTER TABLE customer_address DROP CONSTRAINT customer_address_cluster; 切换列存表的存储格式： 1 ALTER TABLE customer_address SET (COLVERSION = 1.0); 修改表的分布方式： 1 ALTER TABLE customer_address DISTRIBUTE BY REPLICATION; 修改表模式： 1 ALTER TABLE customer_address SET SCHEMA tpcds; 单表冷热切换： 1 ALTER TABLE cold_hot_table REFRESH STORAGE; 列存分区表修改为冷热表： 1 2 3 4 5 6 7 CREATE table test_1(id int,d_time date) WITH(ORIENTATION=COLUMN) DISTRIBUTE BY HASH (id) PARTITION BY RANGE (d_time) (PARTITION p1 START('2022-01-01') END('2022-01-31') EVERY(interval '1 day')) ALTER TABLE test_1 SET (storage_policy = 'LMT:100'); 修改表缓存策略（仅存算分离3.0版本集群支持）： ALTER TABLE orders SET (cache_policy = 'NONE');

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-ALTER TABLE:语法格式

语法格式修改表的定义。 1 2 ALTER TABLE [ IF EXISTS ] { table_name [*] | ONLY table_name | ONLY ( table_name ) } action [, ... ]; 其中具体表操作action可以是以下子句之一： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 column_clause | ADD table_constraint [ NOT VALID ] | ADD table_constraint_using_index | VALIDATE CONSTRAINT constraint_name | DROP CONSTRAINT [ IF EXISTS ] constraint_name [ RESTRICT | CASCADE ] | CLUSTER ON index_name | SET WITHOUT CLUSTER | SET ( {storage_parameter = value} [, ... ] ) | RESET ( storage_parameter [, ... ] ) | OWNER TO new_owner | SET TABLESPACE new_tablespace | SET {COMPRESS|NOCOMPRESS} | DISTRIBUTE BY { REPLICATION | ROUNDROBIN | { HASH ( column_name [,...] ) } } | TO { GROUP groupname | NODE ( nodename [, ... ] ) } | ADD NODE ( nodename [, ... ] ) | DELETE NODE ( nodename [, ... ] ) | DISABLE TRIGGER [ trigger_name | ALL | USER ] | ENABLE TRIGGER [ trigger_name | ALL | USER ] | ENABLE REPLICA TRIGGER trigger_name | ENABLE ALWAYS TRIGGER trigger_name | DISABLE ROW LEVEL SECURITY | ENABLE ROW LEVEL SECURITY | FORCE ROW LEVEL SECURITY | NO FORCE ROW LEVEL SECURITY | REFRESH STORAGE ADD table_constraint [ NOT VALID ] 给表增加一个新的约束。 ADD table_constraint_using_index 根据已有唯一索引为表增加主键约束或唯一约束。 VALIDATE CONSTRAINT constraint_name 验证一个外键或是一个使用NOT VALID选项创建的检查类约束，通过扫描全表来保证所有记录都符合约束条件。如果约束已标记为有效时，什么操作也不会发生。 DROP CONSTRAINT [ IF EXISTS ] constraint_name [ RESTRICT | CASCADE ] 删除一个表上的约束。 CLUSTER ON index_name 为将来的CLUSTER操作选择默认索引。实际上并没有重新盘簇化处理该表。 SET WITHOUT CLUSTER 从表中删除最新使用的CLUSTER索引。这样会影响将来那些没有声明索引的集群操作。 SET ( {storage_parameter = value} [, ... ] ) 修改表的一个或多个存储参数。 RESET ( storage_parameter [, ... ] ) 重置表的一个或多个存储参数。与SET一样，根据参数的不同可能需要重写表才能获得想要的效果。 OWNER TO new_owner 将表、序列、视图的属主改变成指定的用户。 SET {COMPRESS|NOCOMPRESS} 修改表的压缩特性。表压缩特性的改变只会影响后续批量插入的数据的存储方式，对已有数据的存储毫无影响。也就是说，表压缩特性的修改会导致该表中同时存在着已压缩和未压缩的数据。 DISTRIBUTE BY { REPLICATION | ROUNDROBIN | { HASH ( column_name [,...] ) } } 修改表的分布方式，在修改表分布信息的同时会将表数据在物理上按新分布方式重新分布，修改完成后建议对被修改表执行ANALYZE，以便收集全新的统计信息。本操作属于重大变更操作，涉及表分布信息的修改以及数据的物理重分布，修改过程中会阻塞业务，修改完成后原有业务的执行计划会发生变化，请按照正规变更流程进行。本操作属于资源密集操作，针对大表的分布方式修改，建议在计算和存储资源充裕情况下进行，保证整个集群和原表所在表空间有足够的剩余空间能存储一张与原表同等大小且按照新分布方式进行分布的表。 TO { GROUP groupname | NODE ( nodename [, ... ] ) } 此语法仅在扩展模式（GUC参数enable_cluster_resize为on时）下可用。该模式谨慎打开，主要供内部扩容工具使用，一般用户不应使用该模式。 ADD NODE ( nodename [, ... ] ) 此语法主要供内部扩容工具使用，一般用户不建议使用。 DELETE NODE ( nodename [, ... ] ) 此语法主要供内部缩容工具使用，一般用户不建议使用。 DISABLE TRIGGER [ trigger_name | ALL | USER ] 禁用trigger_name所表示的单个触发器，或禁用所有触发器，或仅禁用用户触发器（此选项不包括内部生成的约束触发器，例如，可延迟唯一性和排除约束的约束触发器）。应谨慎使用此功能，因为如果不执行触发器，则无法保证原先期望的约束的完整性。 ENABLE TRIGGER [ trigger_name | ALL | USER ] 启用trigger_name所表示的单个触发器，或启用所有触发器，或仅启用用户触发器。 ENABLE REPLICA TRIGGER trigger_name 触发器触发机制受配置变量session_replication_role的影响，当复制角色为“origin”（默认值）或“local”时，将触发简单启用的触发器。配置为ENABLE REPLICA的触发器仅在会话处于“replica”模式时触发。 ENABLE ALWAYS TRIGGER trigger_name 无论当前复制模式如何，配置为ENABLE ALWAYS的触发器都将触发。 DISABLE/ENABLE ROW LEVEL SECURITY 开启或关闭表的行访问控制开关。当开启行访问控制开关时，如果未在该数据表定义相关行访问控制策略，数据表的行级访问将不受影响；如果关闭表的行访问控制开关，即使定义了行访问控制策略，数据表的行访问也不受影响。详细信息参见CREATE ROW LEVEL SECURITY POLICY章节。 NO FORCE/FORCE ROW LEVEL SECURITY 强制开启或关闭表的行访问控制开关。默认情况，表所有者不受行访问控制特性影响，但当强制开启表的行访问控制开关时，表的所有者（不包含系统管理员用户）会受影响。系统管理员可以绕过所有的行访问控制策略，不受影响。 REFRESH STORAGE 根据OBS冷热表storage_policy所定义的规则，将符合条件的本地热分区切换为存储在OBS上的冷分区。例如创建OBS冷热表时，设置storage_policy为 'LMT:10'，则在执行该操作时可将10日前无修改的分区切为冷存储，存至OBS中。其中列相关的操作column_clause可以是以下子句之一： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 ADD [ COLUMN ] column_name data_type [ compress_mode ] [ COLLATE collation ] [ column_constraint [ ... ] ] | MODIFY [ COLUMN ] column_name data_type | MODIFY [ COLUMN ] column_name [ CONSTRAINT constraint_name ] NOT NULL [ ENABLE ] | MODIFY [ COLUMN ] column_name [ CONSTRAINT constraint_name ] NULL | MODIFY [ COLUMN ] column_name DEFAULT default_expr | MODIFY [ COLUMN ] column_name ON UPDATE on_update_expr | MODIFY [ COLUMN ] column_name COMMENT comment_text | DROP [ COLUMN ] [ IF EXISTS ] column_name [ RESTRICT | CASCADE ] | ALTER [ COLUMN ] column_name [ SET DATA ] TYPE data_type [ COLLATE collation ] [ USING expression ] | ALTER [ COLUMN ] column_name { SET DEFAULT expression | DROP DEFAULT } | ALTER [ COLUMN ] column_name { SET | DROP } NOT NULL | ALTER [ COLUMN ] column_name SET STATIS TICS [PERCENT] integer | ADD STATISTI CS (( column_1_name, column_2_name [, ...] )) | ADD { INDEX | UNIQUE [ INDEX ] } [ index_name ] ( { { column_name | ( expression ) } [ COLLATE collation ] [ opclass ] [ ASC | DESC ] [ NULLS LAST ] } [, ...] ) [ USING method ] [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] [ COMMENT 'text' ] LOCAL [ ( { PARTITION index_partition_name } [, ...] ) ] [ WITH ( { storage_parameter = value } [, ...] ) ] | ADD { INDEX | UNIQUE [ INDEX ] } [ index_name ] ({ { column_name | ( expression ) } [ COLLATE collation ] [ opclass ] [ ASC | DESC ] [ NULLS { FIRST | LAST } ] }[, ...] ) [ USING method ] [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] [ COMMENT 'text' ] [ WITH ( {storage_parameter = value} [, ... ] ) ] [ WHERE predicate ] | DROP { INDEX | KEY } index_name | CHANGE [ COLUMN ] old_column_name new_column_name data_type [ [ CONSTRAINT constraint_name ] NOT NULL [ ENABLE ] | [ CONSTRAINT constraint_name ] NULL | DEFAULT default_expr | COMMENT 'text' ] | DELETE STATISTICS (( column_1_name, column_2_name [, ...] )) | ALTER [ COLUMN ] column_name SET ( {attribute_option = value} [, ... ] ) | ALTER [ COLUMN ] column_name RESET ( attribute_option [, ... ] ) | ALTER [ COLUMN ] column_name SET STORAGE { PLAIN | EXTERNAL | EXTENDED | MAIN } ADD [ COLUMN ] column_name data_type [ compress_mode ] [ COLLATE collation ] [ column_constraint [ ... ] ] 向表中增加一个新的字段。用ADD COLUMN增加一个字段，所有表中现有行都初始化为该字段的缺省值（如果没有声明DEFAULT子句，值为NULL）。 ADD ( { column_name data_type [ compress_mode ] } [, ...] ) 向表中增加多列。 MODIFY [ COLUMN ] column_name data_type 修改表已存在字段的数据类型。需注意：不支持修改分布列数据类型。 MODIFY [ COLUMN ] column_name [ CONSTRAINT constraint_name ] NOT NULL [ ENABLE ] 为表的某列添加not null约束，列存表暂不支持。 MODIFY [ COLUMN ] column_name [ CONSTRAINT constraint_name ] NULL 为表的某列移除not null约束。 MODIFY [ COLUMN ] column_name DEFAULT default_expr 修改表的default值。 MODIFY [ COLUMN ] column_name ON UPDATE on_update_expr 修改表中指定列的on update表达式，该列必须为timestamp类型或者timestamptz类型，当on_update_expr为NULL值时，则为删除ON UPDATE子句。 MODIFY [ COLUMN ] column_name COMMENT comment_text 修改表的注释信息。 DROP [ COLUMN ] [ IF EXISTS ] column_name [ RESTRICT | CASCADE ] 从表中删除一个字段，和这个字段相关的索引和表约束也会被自动删除。如果任何表之外的对象依赖于这个字段，必须声明CASCADE ，比如外键参考、视图等。 DROP COLUMN命令并不是物理上把字段删除，而只是简单地把它标记为对SQL操作不可见。随后对该表的插入和更新将在该字段存储一个NULL。因此，删除一个字段是很快的，但是它不会立即释放表在磁盘上的空间，因为被删除了的字段占据的空间还没有回收。这些空间将在执行VACUUM时而得到回收。 ALTER [ COLUMN ] column_name [ SET DATA ] TYPE data_type [ COLLATE collation ] [ USING expression ] 改变表字段的数据类型，只允许相同大类的类型转换（数值之间，字符串之间，时间之间等）。该字段涉及的索引和简单的表约束将被自动地转换为使用新的字段类型，方法是重新分析最初提供的表达式。 ALTER TYPE要求重写整个表的特性有时候是一个优点，因为重写的过程消除了表中没用的空间。比如，要想立刻回收被一个已经删除的字段占据的空间，最快的方法是 1 ALTER TABLE table ALTER COLUMN anycol TYPE anytype; 这里的anycol是任何在表中还存在的字段，而anytype是和该字段的原类型一样的类型。这样的结果是在表上没有任何可见的语意的变化，但是这个命令强制重写，这样就删除了不再使用的数据。 ALTER [ COLUMN ] column_name { SET DEFAULT expression | DROP DEFAULT } 为一个字段设置或者删除缺省值。请注意缺省值只应用于随后的INSERT命令，它们不会修改表中已经存在的行。也可以为视图创建缺省，这个时候它们是在视图的ON INSERT规则应用之前插入到INSERT句中的。 ALTER [ COLUMN ] column_name { SET | DROP } NOT NULL 修改一个字段是否允许NULL值或者拒绝NULL值。如果表在字段中包含非NULL，则只能使用SET NOT NULL。 ALTER [ COLUMN ] column_name SET STATISTICS [PERCENT] integer 为随后的ANALYZE操作设置针对每个字段的统计收集目标。目标的范围可以在0到10000之内设置。设置为-1时表示重新恢复到使用系统缺省的统计目标。 ADD { INDEX | UNIQUE [ INDEX ] } [ index_name ] ( { { column_name | ( expression ) } [ COLLATE collation ] [ opclass ] [ ASC | DESC ] [ NULLS LAST ] } [, ...] ) [ USING method ] [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] [ COMMENT 'text' ] LOCAL [ ( { PARTITION index_partition_name } [, ...] ) ] [ WITH ( { storage_parameter = value } [, ...] ) ] 为表的分区表创建索引，具体参数可参考CREATE INDEX。 ADD { INDEX | UNIQUE [ INDEX ] } [ index_name ] ({ { column_name | ( expression ) } [ COLLATE collation ] [ opclass ] [ ASC | DESC ] [ NULLS { FIRST | LAST } ] }[, ...] ) [ USING method ] [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] [ COMMENT 'text' ] [ WITH ( {storage_parameter = value} [, ... ] ) ] [ WHERE predicate ] 在表上创建索引，具体参数可参考CREATE INDEX。 DROP { INDEX | KEY } index_name 删除一个表上的索引。 CHANGE [ COLUMN ] old_column_name new_column_name data_type [ [ CONSTRAINT constraint_name ] NOT NULL [ ENABLE ] | [ CONSTRAINT constraint_name ] NULL | DEFAULT default_expr | COMMENT 'text' ] 修改表中列信息，可将旧列名修改成新列名，以及修改列字段信息。 {ADD | DELETE} STATISTICS ((column_1_name, column_2_name [, ...])) 用于添加和删除多列统计信息声明（不实际进行多列统计信息收集），以便在后续进行全表或全库analyze时进行多列统计信息收集。每组多列统计信息最多支持32列。不支持添加/删除多列统计信息声明的表：系统表、外表。 ALTER [ COLUMN ] column_name SET ( {attribute_option = value} [, ... ] ) ALTER [ COLUMN ] column_name RESET ( attribute_option [, ... ] ) 设置/重置属性选项。属性选项定义的参数有：n_distinct、n_distinct_inherited和cstore_cu_sample_ratio。n_distinct设置并固定表的distinct值统计信息，n_distinct_inherited设置并固定继承表的distinct值统计信息，cstore_cu_sample_ratio设置对cstore列存表进行analyze时所选CU的比例。目前，禁止SET/RESET n_distinct_inherited参数。 n_distinct 手动设置该列的distinct值统计信息。取值范围：-1.0 ~ INT_MAX 默认值：0，表示不设置。 n_distinct_inherited 手动设置继承表的该列的distinct值统计信息。取值范围：-1.0 ~ INT_MAX 默认值：0，表示不设置。 cstore_cu_sample_ratio 设置列存表执行analyze，计算需要采样的CU个数时，需要扩大的倍数。取值范围：1.0 ~ 10000.0 默认值：1.0 ALTER [ COLUMN ] column_name SET STORAGE { PLAIN | EXTERNAL | EXTENDED | MAIN } 为一个字段设置存储模式。这个设置控制这个字段是内联保存还是保存在一个附属的表里，以及数据是否要压缩。仅支持对行存表的设置；对列存表没有意义，执行时报错。SET STORAGE本身并不改变表上的任何东西，只是设置将来的表操作时，建议使用的策略。其中列约束column_constraint为： 1 2 3 4 5 6 7 8 [ CONSTRAINT constraint_name ] { NOT NULL | NULL | CHECK ( expression ) | DEFAULT default_expr | UNIQUE [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] index_parameters | PRIMARY KEY index_parameters } [ DEFERRABLE | NOT DEFERRABLE | INITIALLY DEFERRED | INITIALLY IMMEDIATE ] 其中列的压缩可选项compress_mode为： 1 [ DELTA | PREFIX | DICTIONARY | NUMSTR | NOCOMPRESS ] 其中根据已有唯一索引为表增加主键约束或唯一约束table_constraint_using_index为： 1 2 3 [ CONSTRAINT constraint_name ] { UNIQUE | PRIMARY KEY } USING INDEX index_name [ DEFERRABLE | NOT DEFERRABLE | INITIALLY DEFERRED | INITIALLY IMMEDIATE ] 其中增加外键约束REFEREN CES 为： 1 2 [ CONSTRAINT constraint_name ] FOREIGN KEY ( column_name [, ... ] ) REFERENCES reftable [ ( refcolumn [, ... ] ) ] } 其中表约束table_constraint为： 1 2 3 4 5 6 [ CONSTRAINT constraint_name ] { CHECK ( expression ) | UNIQUE [ NULLS [ NOT ] DISTINCT | NULLS IGNORE ] ( column_name [, ... ] ) index_parameters | PRIMARY KEY ( column_name [, ... ] ) index_parameters } [ DEFERRABLE | NOT DEFERRABLE | INITIALLY DEFERRED | INITIALLY IMMEDIATE ] 其中索引参数index_parameters为： 1 2 [ WITH ( {storage_parameter = value} [, ... ] ) ] [ USING INDEX TABLESPACE tablespace_name ]

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-ALTER TABLE:注意事项

注意事项只有表的所有者或者被授予了表ALTER权限的用户有权限执行ALTER TABLE命令，系统管理员默认拥有此权限。但要修改表的所有者或者修改表的模式，当前用户必须是该表的所有者或者系统管理员，且该用户是新的所有角色的直接或间接成员。不支持修改存储参数ORIENTATION。 SET SCHEMA操作不支持修改为系统内部模式，当前仅支持用户模式之间的修改。列存表支持PARTIAL CLUSTER KEY，不支持外键表级约束。列存表自8.1.1集群版本开始支持主键和唯一表级约束。行存REPLICATION分布表不支持将系统列设置为主键。列存表只支持添加字段ADD COLUMN、修改字段的数据类型ALTER TYPE、设置单个字段的收集目标SET STATISTICS、支持更改表名字、支持删除字段DROP COLUMN。对于添加的字段和修改的字段类型要求是列存支持的数据类型。ALTER TYPE的USING选项只支持常量表达式和涉及本字段的表达式，暂不支持涉及其他字段的表达式。列存表支持的字段约束包括NULL、NOT NULL和DEFAULT常量值；对字段约束的修改，当前支持对DEFAULT值的修改（SET DEFAULT）、删除（DROP DEFAULT）和NOT NULL约束的删除；支持对列存表添加非空约束NOT NULL以及主键约束。该约束仅8.2.0及以上集群版本支持。修改列存表存储参数COLVERSION或者enable_delta时，不能与其他ALTER操作同时进行。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-TRUNCATE:注意事项

注意事项请谨慎执行TRUNCATE TABLE，确认表数据可以删除后，再执行删除操作。TRUNCATE TABLE命令删除表数据后，数据将无法恢复。存算分离架构下，不支持同时TRUNCATE普通表和临时表。避免在业务高峰期执行ALTER TABLE/ALTER TABLE PARTITION（增删改查、DROP PARTITION）、TRUNCATE操作，避免有长SQL阻塞AlTER、TRUNCATE操作或SQL业务被ALTER、TRUNCATE阻塞。更多开发设计规范参见总体开发设计规范。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-TRUNCATE:TRUNCATE TABLE说明

TRUNCATE TABLE说明 TRUNCATE TABLE在功能上与不带WHERE子句DELETE语句相同：二者均删除表中的全部行。 TRUNCATE TABLE比DELETE速度快且使用系统和事务日志资源少： DELETE语句每次删除一行，并在事务日志中为所删除每行记录一项。 TRUNCATE TABLE通过释放存储表数据所用数据页来删除数据，并且只在事务日志中记录页的释放。 TRUNCATE，DELETE，DROP三者的差异如下： TRUNCATE TABLE，删除内容，释放空间，但不删除定义。 DELETE TABLE，删除内容，不删除定义，不释放空间。 DROP TABLE，删除内容和定义，释放空间。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-TRUNCATE:参数说明

参数说明 ONLY 如果声明ONLY，只有指定的表会被清空。如果没有声明ONLY，这个表以及其所有子表（若有）会被清空。 database_name 目标表的数据库名称。 schema_name 目标表的模式名称。 table_name 目标表的名字（可以有模式修饰）。取值范围：已存在的表名。 CONTINUE IDENTITY 不改变序列的值。这是缺省值。 CASCADE | RESTRICT CASCADE：级联清空所有在该表上有外键引用的表，或者由于CASCADE而被添加到组中的表。 RESTRICT（缺省值）：如果其他表在该表上有外键引用则拒绝清空。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-CLUSTER:功能描述

功能描述根据一个索引对表进行聚簇排序。 CLUSTER指示GaussDB(DWS)基于索引名指定的索引来聚簇由表名指定的表。索引名指定的索引必须已经定义在指定表上。当对一个表聚簇后，该表将基于索引信息进行物理排序。聚簇是一次性操作：当表被更新之后，更改的内容不会被聚簇。也就是说，系统不会试图按照索引顺序对新的存储内容及更新记录进行重新聚簇。在对一个表聚簇之后，GaussDB(DWS)会记录在哪个索引上建立了聚簇。形式CLUSTER table_name会使用前面所用的同一个索引对表重新聚簇。用户也可以用CLUSTER或ALTER TABLE的SET WITHOUT CLUSTER形式把索引设置为可用于后续的聚簇操作或清除任何之前的设置。不含参数的CLUSTER会将当前用户所拥有的数据库中的先前做过聚簇的所有表重新聚簇，如果是系统管理员调用，则是所有已被聚簇过的表。在对一个表进行聚簇的时候，会在其上请求一个ACCESS EXCLUSIVE锁。这样就避免了在CLUSTER完成之前对此表执行其它的操作(包括读写)。

数据仓库服务 GAUSSDB(DWS) DDL语法
数据仓库服务 GAUSSDB(DWS)-CLUSTER:示例

示例创建一个分区表： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 CREATE TABLE tpcds.inventory_p1 ( INV_DATE_SK INTEGER NOT NULL, INV_ITEM_SK INTEGER NOT NULL, INV_WAREHOUSE_SK INTEGER NOT NULL, INV_QUANTITY_ON_HAND INTEGER ) DISTRIBUTE BY HASH(INV_ITEM_SK) PARTITION BY RANGE(INV_DATE_SK) ( PARTITION P1 VALUES LESS THAN(2451179), PARTITION P2 VALUES LESS THAN(2451544), PARTITION P3 VALUES LESS THAN(2451910), PARTITION P4 VALUES LESS THAN(2452275), PARTITION P5 VALUES LESS THAN(2452640), PARTITION P6 VALUES LESS THAN(2453005), PARTITION P7 VALUES LESS THAN(MAXVALUE) ); 创建索引ds_inventory_p1_index1。 1 CREATE INDEX ds_inventory_p1_index1 ON tpcds.inventory_p1 (INV_ITEM_SK) LOCAL; 对表tpcds.inventory_p1进行聚集： 1 CLUSTER tpcds.inventory_p1 USING ds_inventory_p1_index1; 对分区p3进行聚集： 1 CLUSTER tpcds.inventory_p1 PARTITION (p3) USING ds_inventory_p1_index1; 对数据库中可以进行聚集的表进聚集： 1 CLUSTER;

数据仓库服务 GAUSSDB(DWS) DDL语法
数据仓库服务 GAUSSDB(DWS)-CLUSTER:注意事项

注意事项只有行存B-tree索引支持CLUSTER操作。如果用户只是随机访问表中的行，那么表中数据的实际存储顺序是无关紧要的。但是，如果对某些数据的访问多于其它数据，而且有一个索引将这些数据分组，那么使用CLUSTER会有所帮助。如果从一个表中请求一定索引范围的值，或者是一个索引值对应多行，CLUSTER也会有助于应用，因为如果索引标识出第一匹配行所在的存储页，所有其它行也可能已经在同一个存储页里了，这样便节省了磁盘访问的时间，加速了查询。在聚簇过程中，系统先创建一个按照索引顺序建立的表的临时拷贝，同时也建立表上的每个索引的临时拷贝。因此，需要磁盘上有足够的剩余空间，至少是表大小和索引大小的和。由于CLUSTER会记忆聚集信息，可以在第一次的时候手工对表进行聚簇，然后设置一个类似VACUUM的时间，这样就可以周期地自动对表进行聚簇操作。因为优化器记录着有关表的排序的统计，所以建议在新近聚簇的表上运行ANALYZE。否则，优化器可能会选择很差劲的查询规划。 CLUSTER不允许在事务中执行。对表执行CLUSTER操作时会触发表重建（表重建过程中会先把数据转储到一个新的数据文件中，重建完成之后会删除原始文件），当表比较大时，重建会消耗较多的磁盘空间。当磁盘空间不足时，要谨慎对待大表CLUSTER操作，防止触发集群只读。存算分离架构下，对CLUSTER全库的操作会有提示不支持。

数据仓库服务 GAUSSDB(DWS) DDL语法
数据仓库服务 GAUSSDB(DWS)-CLUSTER:语法格式

语法格式对一个表进行聚簇排序。 1 CLUSTER [ VERBOSE ] table_name [ USING index_name ]; 对一个分区进行聚簇排序。 1 CLUSTER [ VERBOSE ] table_name PARTITION ( partition_name ) [ USING index_name ]; 对已做过聚簇的表重新进行聚簇。 1 CLUSTER [ VERBOSE ];

数据仓库服务 GAUSSDB(DWS) DDL语法
数据仓库服务 GAUSSDB(DWS)-PGXC_WLM_SESSION_INFO

PGXC_WLM_SESSION_INFO PGXC_WLM_SESSION_INFO视图显示在所有CN上执行作业结束后的负载管理记录。此视图的数据直接从系统表GS_WLM_SESSION_INFO获取。表1 PGXC_WLM_SESSION_INFO的字段名称类型描述 datid oid 连接后端的数据库OID。 dbname text 连接后端的数据库名称。 schemaname text 模式名。 nodename text 语句执行的CN名称。 username text 连接到后端的用户名。 application_name text 连接到后端的应用名。 client_addr inet 连接到后端的客户端的IP地址。如果此字段是null，它表明通过服务器机器上UNIX套接字连接客户端或者这是内部进程，如autovacuum。 client_hostname text 客户端的主机名，这个字段是通过client_addr的反向DNS查找得到。这个字段只有在启动log_hostname且使用IP连接时才非空。 client_port integer 客户端用于与后端通讯的TCP端口号，如果使用Unix套接字，则为-1。 query_band text 用于标示作业类型，可通过GUC参数query_band进行设置，默认为空字符串。 block_time bigint 语句执行前的阻塞时间，包含语句解析和优化时间，单位ms。 start_time timestamp with time zone 语句执行的开始时间。 finish_time timestamp with time zone 语句执行的结束时间。 duration bigint 语句实际执行的时间，单位ms。 estimate_total_time bigint 语句预估执行时间，单位ms。 status text 语句执行结束状态：正常为finished，异常为aborted。该处记录的语句状态应为数据库服务端执行状态，当服务器端执行成功，结果集返回时报错，该语句应为finished。 abort_info text 语句执行结束状态为aborted时显示异常信息。 resource_pool text 用户使用的资源池。 control_group text 语句所使用的Cgroup。 estimate_memory integer 语句在单个实例上预估使用的内存，单位MB。该字段只有当GUC参数enable_dynamic_workload为on时才有效。 min_peak_memory integer 语句在所有DN上的最小内存峰值，单位MB。 max_peak_memory integer 语句在所有DN上的最大内存峰值，单位MB。 average_peak_memory integer 语句执行过程中的内存使用平均值，单位MB。 memory_skew_percent integer 语句各DN间的内存使用倾斜率。 spill_info text 语句在所有DN上的下盘信息： None：所有DN均未下盘。 All：所有DN均下盘。 [a:b]：数量为b个DN中有a个DN下盘。 min_spill_size integer 若发生下盘，所有下盘DN的最小下盘数据量(MB)，默认为0。 max_spill_size integer 若发生下盘，所有下盘DN的最大下盘数据量(MB)，默认为0。 average_spill_size integer 若发生下盘，所有下盘DN的平均下盘数据量(MB)，默认为0。 spill_skew_percent integer 若发生下盘，DN间下盘倾斜率。 min_dn_time bigint 语句在所有DN上的最小执行时间，单位ms。 max_dn_time bigint 语句在所有DN上的最大执行时间，单位ms。 average_dn_time bigint 语句在所有DN上的平均执行时间，单位ms。 dntime_skew_percent integer 语句在各DN间的执行时间倾斜率。 min_cpu_time bigint 语句在所有DN上的最小CPU时间，单位ms。 max_cpu_time bigint 语句在所有DN上的最大CPU时间，单位ms。 total_cpu_time bigint 语句在所有DN上的CPU总时间，单位ms。 cpu_skew_percent integer 语句在DN间的CPU时间倾斜率。 min_peak_iops integer 语句在所有DN上的每秒最小IO峰值（列存单位是次/s，行存单位是万次/s）。 max_peak_iops integer 语句在所有DN上的每秒最大IO峰值（列存单位是次/s，行存单位是万次/s）。 average_peak_iops integer 语句在所有DN上的每秒平均IO峰值（列存单位是次/s，行存单位是万次/s）。 iops_skew_percent integer 语句在DN间的IO倾斜率。 warning text 主要显示如下几类告警信息以及SQL自诊断调优相关告警： Spill file size large than 256MB Broadcast size large than 100MB Early spill Spill times is greater than 3 Spill on memory adaptive Hash table conflict queryid bigint 语句执行使用的内部query id。 query text 执行的语句，最多可保留64KB长度的字符串。 query_plan text 语句的执行计划。规格限制： DML语句都会显示执行计划，DDL语句不显示执行计划。当用户下发PBE(Parse Bind Execute)批处理语句时，为了便于分析语句情况，自8.2.1.100集群版本开始，为批处理的PBE语句的执行计划添加数据绑定次数，显示为“PBE bind times：次数”格式。 node_group text 语句所属用户对应的逻辑集群。 pid bigint 语句的后端线程的PID。 lane text 语句执行时所在的快慢车道。 unique_sql_id bigint 归一化的Unique SQL ID。 session_id text 在数据库系统中唯一标记一个session，格式：session_start_time.tid.node_name。 min_read_bytes bigint 语句在所有DN上的最小IO读字节数，单位Bytes。 max_read_bytes bigint 语句在所有DN上的最大IO读字节数，单位Bytes。 average_read_bytes bigint 语句在所有DN上的平均IO读字节数，单位Bytes。 min_write_bytes bigint 语句在所有DN上的最小IO写字节数，单位Bytes。 max_write_bytes bigint 语句在所有DN上的最大IO写字节数，单位Bytes。 average_write_bytes bigint 语句在所有DN上的平均IO写字节数，单位Bytes。 recv_pkg bigint 语句在所有DN上的通信包接收总量，单位packages。 send_pkg bigint 语句在所有DN上的通信包发送总量，单位packages。 recv_bytes bigint 语句在所有DN上的通信流接收数据总量，单位Byte。 send_bytes bigint 语句在所有DN上的通信流发送数据总量，单位Byte。 stmt_type text 语句对应的查询类型。 except_info text 语句触发的异常规则信息。 parse_time bigint 语句排队前的解析总时间（包含词法语法解析，优化重写和计划生成时间），单位ms。该字段仅8.3.0.100及以上版本支持。 unique_plan_id bigint 归一化的Unique plan id。 sql_hash text 归一化的sql hash。 plan_hash text 归一化的plan hash。 disk_cache_hit_ratio numeric(5,2) 磁盘缓存命中率。该字段仅对3.0表及外表生效。 disk_cache_disk_read_size bigint 读取磁盘缓存数据的总大小，单位MB。该字段仅对3.0表及外表生效。 disk_cache_disk_write_size bigint 写入磁盘缓存的数据总大小，单位MB。该字段仅对3.0表及外表生效。 disk_cache_remote_read_size bigint 读取磁盘缓存失败，远程直读OBS的总大小，单位MB。该字段仅对3.0表及外表生效。 disk_cache_remote_read_time bigint 读取磁盘缓存失败，远程直读OBS的次数。该字段仅对3.0表及外表生效。 vfs_scan_bytes bigint OBS虚拟文件系统接收到上层请求的扫描的字节数，单位Bytes。该字段仅对3.0表及外表生效。 vfs_remote_read_bytes bigint OBS虚拟文件系统实际从OBS读取的字节数，单位Bytes。该字段仅对3.0表及外表生效。 preload_submit_time bigint 预读流程提交IO请求的总时间，单位μs。该字段仅对3.0表生效。 preload_wait_time bigint 预读流程等待IO请求的总时间，单位μs。该字段仅对3.0表生效。 preload_wait_count bigint 预读流程等待IO请求的总次数。该字段仅对3.0表生效。 disk_cache_load_time bigint 读取磁盘缓存的总时间，单位μs。该字段仅对3.0表及外表生效。 disk_cache_conflict_count bigint 读取磁盘缓存中block产生哈希冲突的次数。该字段仅对3.0表及外表生效。 disk_cache_error_count bigint 读取磁盘缓存失败的次数。该字段仅对3.0表及外表生效。 disk_cache_error_code bigint 读取磁盘缓存失败的错误码。该字段仅对3.0表及外表生效。 obs_io_req_avg_rtt bigint OBS IO请求的平均RTT(Round Trip Time，IO请求往返时间)，单位为μs。该字段仅对3.0表及外表生效。 obs_io_req_avg_latency bigint OBS IO请求的平均延迟，单位为μs。该字段仅对3.0表及外表生效。 obs_io_req_latency_gt_1s bigint OBS IO请求延迟超过1s的数量。该字段仅对3.0表及外表生效。 obs_io_req_latency_gt_10s bigint OBS IO请求延迟超过10s的数量。该字段仅对3.0表及外表生效。 obs_io_req_count bigint OBS IO请求的总数量。该字段仅对3.0表及外表生效。 obs_io_req_retry_count bigint OBS IO请求重试的总次数。该字段仅对3.0表及外表生效。 obs_io_req_rate_limit_count bigint OBS IO请求被流控的总次数。该字段仅对3.0表及外表生效。父主题：系统视图

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-Scan方式的Hint:参数说明

参数说明 no表示hint的scan方式不使用。 block_name表示语句块的block_name，详细说明请参考block_name。 table表示hint指定的表，只能指定一个表，如果表存在别名应优先使用别名进行hint。表的语法格式如下： [schema.]table[@block_name] 表名可以带schema，也可以带所在子查询语句块提升前的block_name。子查询语句块在优化器进行优化重写的发生提升，则该block_name会与leading中block_name不同。表如果存在别名，优先使用别名来表示该表。 index表示使用indexscan或indexonlyscan的hint时，指定的索引名称，当前只能指定一个。对于indexscan或indexonlyscan，只有hint的索引属于hint的表时，才能使用该hint。 scan hint支持在行列存表、hdfs内外表、obs表、子查询表上指定。对于hdfs内表，由主表和delta表组成，delta表对用户不可见，故hint仅作用在主表上。指定indexscan可生效indexscan或indexonlyscan，indexscan或indexonlyscan也可同时出现。当indexscan和indexonlyscan hint同时出现，优先生效indexonlyscan。

数据仓库服务 GAUSSDB(DWS)
数据仓库服务 GAUSSDB(DWS)-GS_WLM_SESSION_INFO

GS_WLM_SESSION_INFO GS_WLM_SESSION_INFO系统表显示所有CN执行作业结束后的负载管理记录。此数据是从内核中转储到系统表中的数据。当设置GUC参数enable_resource_record为on时，系统会定时将GS_WLM_SESSION_HISTORY中的记录导入此系统表，开启此功能会占用系统存储空间并对性能有一定影响，不建议用户使用。具体的字段请参考表1。此系统表的schema是dbms_om。此系统表在gaussdb数据库中有分布列，分布列是queryid，其它数据库中无分布列。 pg_catalog下存在GS_WLM_SESSION_INFO视图。父主题：系统表

数据仓库服务 GAUSSDB(DWS)

共100000条

undefined

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

华为云用户手册

7*24

备案

专业服务

退订

建议反馈

售前咨询热线