检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
案例:改写SQL消除子查询 现象描述 1 2 3 4 select 1, (select count(*) from normal_date n where n.id = a.id) as GZCS from normal_date a; 此SQL性能较差,查看发现执行计划中存在SubPlan,具体如下:
案例:改写SQL消除子查询 现象描述 1 2 3 4 select 1, (select count(*) from normal_date n where n.id = a.id) as GZCS from normal_date a; 此SQL性能较差,查看发现执行计划中存在SubPlan,具体如下:
案例:改写SQL消除子查询 现象描述 1 2 3 4 select 1, (select count(*) from normal_date n where n.id = a.id) as GZCS from normal_date a; 此SQL性能较差,查看发现执行计划中存在SubPlan,具体如下:
参数解释: 节点ID。 取值范围: 只能由英文字母、数字组成,且长度为36个字符。 name String 参数解释: 节点名称。 取值范围: 以字母开头,可以包含字母、数字、中划线或下划线,不能包含其他特殊字符。 role String 参数解释: 节点类型,代表节点在实例中所处的角色。
GZCS from customer_address_001 a; 此SQL性能较差,查看发现执行计划中存在SubPlan,具体如下: 优化说明 此优化的核心就是消除子查询。分析业务场景发现a.ca_address_sk不为NULL,那么从SQL语义出发,可以等价改写SQL为: 1
GZCS from customer_address_001 a; 此SQL性能较差,查看发现执行计划中存在SubPlan,具体如下: 优化说明 此优化的核心就是消除子查询。分析业务场景发现a.ca_address_sk不为null,那么从SQL语义出发,可以等价改写SQL为: 1
Gather减少计划中的Stream节点 DN Gather用来把分布式计划中的Stream节点去掉,把数据发送到一个节点进行计算,这样可以减少分布式计划执行时数据重分布的代价,从而提升单个查询以及系统整体的吞吐能力。不过DN Gather面向的是TP的小数据量场景,对于小数据量查询因为节省了数据重
节点类型,代表节点在实例中所处的角色。 取值范围: master:主节点。 slave:备节点。 secondary:日志节点。 readreplica:只读节点。 status String 参数解释: 节点状态。 取值范围: 值为“BUILD_FAILED”,表示节点创建失败。 availability_zone
_INFO 该视图用于查看分布式下所有节点实时的资源池CPU使用情况。查询该视图需要sysadmin权限或者monadmin权限。 该视图只能查询主DN节点上的数据,备节点需要登录到备节点上后使用系统函数gs_wlm_respool_cpu_info()查询CPU使用情况。 表1
_INFO 该视图用于查看分布式下所有节点实时的资源池I/O使用情况。查询该视图需要sysadmin权限或者monadmin权限。 该视图只能查询主DN节点上的数据,备节点需要登录到备节点上后使用系统函数gs_wlm_respool_io_info()查询I/O使用情况。 表1
作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr、to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。
查询回收站所有引擎实例列表 功能介绍 查询回收站所有引擎实例列表。 调用接口前,您需要了解API 认证鉴权。 调用接口前,您需要提前获取到地区和终端节点,即下文中的Endpoint值。 调试 您可以在API Explorer中调试该接口。 URI GET https://{End
查询回收站所有引擎实例列表 功能介绍 查询回收站所有引擎实例列表。 调用接口前,您需要了解API 认证鉴权。 调用接口前,您需要提前获取到地区和终端节点,即下文中的Endpoint值。 调试 您可以在API Explorer中调试该接口。 URI GET https://{Endpoint}/v3
作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr、to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。
数据倾斜查询最佳实践 快速定位查询存储倾斜的表 父主题: 最佳实践
数据倾斜查询最佳实践 快速定位查询存储倾斜的表 父主题: 最佳实践
作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr、to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。
作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000万行,hash bucket只有1000。 函数(如substr、to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。
作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr、to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。
作业中多个SQL有同样的子查询,并且子查询数据量较大。 Plan cost计算不准,导致子查询hash bucket太小,比如实际数据1000W行,hash bucket只有1000。 函数(如substr、to_number)导致大数据量子查询选择度计算不准。 多DN环境下对大表做broadcast的子查询。