检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
TPC-DS测试集 您可以通过命令生成方法生成TPC-DS测试集,也可以直接通过脚本生成方法生成,另我们已经给出前面20个的TPC-DS测试集供您参考。 命令生成方法 TPC-DS标准99个SQL查询语句可用如下方法生成: 准备工作。生成TPC-DS查询语句前需要修改query_templates目录下的文件:
TY中查询到。 ForExtensionConnector ETL工具性能优化参数,可进行内存优化,降低对端的CN内存占用,避免因CN内存使用过多导致系统不稳定。 可选值0或者1,默认为0,表示不开启优化项。 请勿在数据库系统之外的其他业务中配置此参数,以免影响业务的正确性。 F
" SQLSTATE: XX000 错误原因:此语句不支持信息约束优化。 解决办法:信息约束对查询进行优化,避免错误方法,使用set enable_constraint_optimization=off,关闭优化。 GAUSS-04347: "Function with OID %u
逻辑集群管理 2 8.1.0内核版本上线 优化和解决以下问题: Cost代价估算优化。 Analyze强化,支持临时表,支持单事务操作。 向量化引擎性能提升。 分区剪枝优化,当前分区剪枝只能针对常量进行,而对于需要计算的变量不能剪枝,针对此问题进行优化。 新增全量备份(schema粒度)+
警信息。但对于由于FATAL、PANIC错误导致查询异常结束时,状态信息列只显示aborted,无法记录详细异常信息。特别是针对查询解析,优化阶段的状态信息则无法监控。 历史视图具体的对外接口如下表所示: 视图级别 节点范围 查询视图 query级别/perf级别 当前CN 历史
IN对于NULL值的特殊处理,导致语句无法使用高效的HashJoin进行高效处理,性能较差。 处理方法 若业务场景中用户不关注NULL值的处理,或者数据中根本不存在NULL值,则可以通过等价改写将NOT IN改写为NOT EXISTS来进行优化。 父主题: 集群性能
TY中查询到。 ForExtensionConnector ETL工具性能优化参数,可进行内存优化,降低对端的CN内存占用,避免因CN内存使用过多导致系统不稳定。 可选值0或者1,默认为0,表示不开启优化项。 请勿在数据库系统之外的其他业务中配置此参数,以免影响业务的正确性。 F
问题分析:JDBC未实现接口。 处理方法:需要技术人员研究接口是否可实现,或是否有其他接口已提供相同功能,调整业务使用已提供接口。 JDK标准接口中未提供相关功能 问题分析:JDK未提供标准接口。 处理方法:理论上如果JDK未提供接口,则JDBC不支持。实际使用中可以使用JDBC类中的public方法获取部分过程数据,绝大部分情况下明确不支持。
Join中进行重分布时存在倾斜,对应原计划的6号算子。生成计划如下所示: 从优化后的计划可以看出:①对于Hash Agg,由于其重分布存在倾斜,所以优化为双层Agg;②对于Hash Join,同样由于其重分布存在倾斜,所以优化为采用新的重分布算子。 需要改写query后进行hint 不带hint的查询和计划如下:
Join中进行重分布时存在倾斜,对应原计划的6号算子。生成计划如下所示: 从优化后的计划可以看出:①对于Hash Agg,由于其重分布存在倾斜,所以优化为双层Agg;②对于Hash Join,同样由于其重分布存在倾斜,所以优化为采用新的重分布算子。 需要改写query后进行hint 不带hint的查询和计划如下:
Join中进行重分布时存在倾斜,对应原计划的6号算子。生成计划如下所示: 从优化后的计划可以看出:①对于Hash Agg,由于其重分布存在倾斜,所以优化为双层Agg;②对于Hash Join,同样由于其重分布存在倾斜,所以优化为采用新的重分布算子。 需要改写query后进行hint 不带hint的查询和计划如下:
application_name text 连接到后端的应用名。 client_addr inet 连接到后端的客户端的IP地址。 如果此字段是null,它表明通过服务器机器上UNIX套接字连接客户端或者这是内部进程,如autovacuum。 client_hostname text 客户端的主机名,这个字段是
NULLS FIRST/LAST options" SQLSTATE: 0A000 错误原因:索引处理方法不支持NULLS/FIRST/LAST选项。 解决办法:重建索引并设置索引列的访问方法(pg_am中amcanorder字段)为true支持索引列排序。 GAUSS-01302: "operator
获取当前在第几行。 获取结果集中的数据 ResultSet对象提供了丰富的方法,以获取结果集中的数据。获取数据常用的方法如表4所示,其他方法请参考JDK官方文档。 表4 ResultSet对象的常用方法 方法 描述 int getInt(int columnIndex) 按列标获取int型数据。
TPC-H测试集 您可以通过命令生成方法生成TPC-H测试集,也可以直接通过脚本生成方法生成,另我们已经给出完整的TPC-H测试集供您参考。 由于版本差异,通过脚本生成的SQL测试集,可能会存在部分SQL执行不成功的情况,请参考测试集进行修正后执行。 命令生成方法 TPC-H 22个标准查询SQL可以用如下方法生成。
获取当前在第几行。 获取结果集中的数据 ResultSet对象提供了丰富的方法,以获取结果集中的数据。获取数据常用的方法如表4所示,其他方法请参考JDK官方文档。 表4 ResultSet对象的常用方法 方法 描述 int getInt(int columnIndex) 按列标获取int型数据。
参数说明:该参数用于控制在特定的客户场景中,使用不同的估算方法使得估算值与真实值更接近。此参数可以同时控制多种方法,与某一方法对应的位做与操作,不为0表示该方法被选择。 当cost_param & 1 不为0,表示对于求不等值连接选择率时选择一种改良机制,此方法在自连接(两个相同的表之间连接)的估算
参数说明:该参数用于控制在特定的客户场景中,使用不同的估算方法使得估算值与真实值更接近。此参数可以同时控制多种方法,与某一方法对应的位做与操作,不为0表示该方法被选择。 当cost_param & 1 不为0,表示对于求不等值连接选择率时选择一种改良机制,此方法在自连接(两个相同的表之间连接)的估算
可以指定列名。 对于多层的查询,可以在每层指定对应层的分布列hint,只在当前层生效。 指定了分布列,如果优化器估算后发现不需要重分布,则指定的分布列无效。 建议 通常优化器会根据统计信息选择一组不倾斜的分布键进行数据重分布。当默认选择的分布键有倾斜时,可以手动指定重分布的列,避免数据倾斜。
指定的count(distinct)列仅针对生成双层hashagg的计划时才生效,否则指定的分布列无效。 指定了分布列,如果优化器估算后发现不需要重分布,则指定的分布列无效。 建议 通常优化器会根据统计信息选择一组不倾斜的分布键进行数据重分布。当默认选择的分布键有倾斜时,可以手动指定重分布的列,避免数据倾斜。