数据仓库服务 GAUSSDB(DWS)-更新统计信息:准确性及可靠性

时间:2024-12-09 15:13:08

准确性及可靠性

表4 准确性及可靠性

准确性及可靠性

分类

说明

准确性

采样大小

可配置为按表大小自适应。由参数default_statistics_target控制。

采样随机性

  • analyze_sample_mode参数设置新支持优化蓄水池和range采样随机性更优。
  • random_function_version参数增强了随机数计算函数的随机性。

全局共享

统计信息可以跨会话和跨节点进行共享。

修改计数广播

后台线程会轮询检全局查修改计数并进行广播。

作业线程也可直接广播修改计数。通过参数tuple_change_sync_threshold设置。

跨CN修改和查询也影响不大,修改计数会异步方式广播同步。

调整CU采样比

CU填充率不高的场景,可调大CU采样比。通过列级参数cstore_cu_sample_ratio设置。

distinct固定

随机采样后distinct值不稳定场景,不调高采样率情况下,可进行distinct值固定。通过列级参数n_distinct设置。

统计信息推算

enable_extrapolation_stats参数可以控制估算失真时,基于旧的统计信息自动推算更准确的统计信息。

可靠性

CN故障

其它CN故障时,不影响动态采样,统计信息不同步,不影响当前CN查询的统计信息质量。

CN恢复

其它CN恢复后,再次查询时会强制动态采样,并全局同步。

DN故障

非当前逻辑集群的DN故障,不影响本逻辑集群的动态采样。

support.huaweicloud.com/devg-910-dws/dws_04_0436.html