检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间,单位为毫秒。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。
status text 当前算子的执行状态,包括finished和running。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。
该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间,单位为毫秒。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。
HLL与其他算法的比较请参见表1。 表1 HLL与其他算法比较 项目 Sort算法 Hash算法 HLL 时间复杂度 O(nlogn) O(n) O(n) 空间复杂度 O(n) O(n) 1280 bytes 误差率 0 0 ≈2% 所需存储空间 原始数据大小 原始数据大小 1280
改”进入“修改告警规则”界面,查看当前告警的配置参数。 调整告警阈值和检测周期配置项,其中上报阈值越大、检测周期越长,则告警的灵敏度越低;反之灵敏度越高。更详细的界面配置说明参考告警规则。 如果数据盘配置较高,建议根据磁盘历史监控指标调大阈值;否则执行其余步骤检查,如果仍无法缓解,则建议进行磁盘扩容。
'分隔。 查询分区表时,会先根据分区信息进行剪枝,然后查询满足条件的数据文件。由于剪枝操作会涉及多次扫描HDFS分区目录内容,不建议使用重复度非常小的列作为分区列,因为这可能导致分区目录非常的多,增加对HDFS的查询压力。 OBS只读外表不支持。 delimiter 指定数据文件行
bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr,to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。 父主题: SQL调优指南
该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间,单位为毫秒。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。
text 当前算子的执行状态,包括waiting、running和finished。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息,若返回的预估行数超过int64_max时,显示为int64_max。 tuple_processed
bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr,to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。 其他更多调优点,请参考典型SQL调优点。 父主题: 数据库管理
HLL与其他算法的比较请参见表1。 表1 HLL与其他算法比较 项目 Sort算法 Hash算法 HLL 时间复杂度 O(nlogn) O(n) O(n) 空间复杂度 O(n) O(n) 1280 bytes 误差率 0 0 ≈2% 所需存储空间 原始数据大小 原始数据大小 1280
该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间,单位为毫秒。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。
时间范围过滤的列,指定为分区列。 点查返回数据量超过10W/dn的场景,索引扫描的性能提升有限,建议针对这种情况使用guc参数enable_seqscan对比测试,灵活选择。 参数说明 IF NOT EXISTS 指定IF NOT EXISTS时,若不存在同名表,则可以成功创建表。若已存在同名表,创
该算子处理第一条数据的开始时间。 duration bigint 该算子到结束时候总的执行时间,单位为毫秒。 query_dop integer 当前算子执行时的并行度。 estimated_rows bigint 优化器估算的行数信息。 tuple_processed bigint 当前算子返回的元素个数。
'分隔。 查询分区表时,会先根据分区信息进行剪枝,然后查询满足条件的数据文件。由于剪枝操作会涉及多次扫描HDFS分区目录内容,不建议使用重复度非常小的列作为分区列,因为这可能导致分区目录非常的多,增加对HDFS的查询压力。 OBS只读外表不支持。 delimiter 指定数据文件行
会导致agg的计算方式出现比较大的偏差,这时候就需要通过best_agg_plan进行agg计算模型的干预。 一般来说,当agg汇聚的收敛度很小时,即结果集的个数在agg之后并没有明显变少时(经验上以5倍为临界点),选择redistribute+hashagg执行方式,否则选择h
常不会影响CN或者DN进程。 FENCED/NOT FENCED模式的选择: 正在开发或者调试的Function使用FENCED模式。开发测试完成,使用NOT FENCED模式执行,减少fork进程以及通信的开销。 复杂的操作系统操作,例:打开文件,信号处理,线程处理等操作,使用
常不会影响CN或者DN进程。 FENCED/NOT FENCED模式的选择: 正在开发或者调试的Function使用FENCED模式。开发测试完成,使用NOT FENCED模式执行,减少fork进程以及通信的开销。 复杂的操作系统操作,例:打开文件,信号处理,线程处理等操作,使用
export ODBCINI=/usr/local/etc/odbc.ini 执行如下命令使设置生效。 source ~/.bashrc 测试数据源配置 执行isql -v GaussODBC(数据源名称)命令。 如果显示如下信息,表明配置正确,连接成功。 +----------
会导致agg的计算方式出现比较大的偏差,这时候就需要通过best_agg_plan进行agg计算模型的干预。 一般来说,当agg汇聚的收敛度很小时,即结果集的个数在agg之后并没有明显变少时(经验上以5倍为临界点),选择redistribute+hashagg执行方式,否则选择h