检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分布式执行框架 GS_235100005 错误码: Stream plan check failed. Execution datanodes list of stream node[%d] mismatch in parent node[%d]. 解决方案:请使用INTERNAL
通过编写shell脚本自动化执行查询和结果收集 登录ECS,进入到/opt目录下,使用vim命令生成query.conf和run_query.sh两个脚本文件。脚本内容如下,编辑后按:wq!保存脚本配置。 run_query.sh脚本如下: 1 2 3 4 5 6 7
ACTIVITYCOUNT ACTIVITYCOUNT 输入 状态变量,返回嵌入式SQL中受DML语句影响的行数。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 SEL
enable_fast_query_shipping 参数说明:控制查询优化器是否使用分布式框架。 参数类型:USERSET 取值范围:布尔型 on表示执行计划在CN和DN上各自生成。 off表示使用分布式框架,即执行计划在CN上生成,然后发送到DN中执行。 默认值:on enable_trigger_shipping
语句下推调优 语句下推介绍 目前,GaussDB(DWS)优化器在分布式框架下制定语句的执行策略时,有三种执行计划方式:生成下推语句计划、生成分布式执行计划、生成发送语句的分布式执行计划。 下推语句计划:指直接将查询语句从CN发送到DN进行执行,然后将执行结果返回给CN。 分布式
执行器 行执行引擎 向量化执行引擎 分布式执行框架
enable_fast_query_shipping=on 控制查询优化器是否使用分布式框架,执行快速执行计划。设置为“on”,表示执行计划在CN和DN上各自生成;设置为“off”,表示使用分布式框架,即执行计划在CN上生成,然后发送到DN中执行。 说明: 如果只需要在当前数据库连接
distribute by hash(a); 假设agg下层算子所输出结果集的分布列为setA,agg操作的group by列为setB,则在Stream框架下,Agg操作可以分为两个场景。 场景一:setA是setB的一个子集。 对于这种场景,直接对下层结果集进行汇聚的结果就是正确的汇聚结果,上层算子直接使用即可。如下图所示:
语句下推调优 语句下推介绍 目前,GaussDB(DWS)优化器在分布式框架下制定语句的执行策略时,有三种执行计划方式:生成下推语句计划、生成分布式执行计划、生成发送语句的分布式执行计划。 下推语句计划:指直接将查询语句从CN发送到DN进行执行,然后将执行结果返回给CN。 分布式
审视和修改表定义 在分布式框架下,数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上,较好的表定义需要满足以下要求: 表数据均匀分布在各个DN上,以防止单个DN对应的存储设备空间不足造成集群有效容量下降。选择合适分布列,避免数据分布倾斜可以实现该点。 表Scan压
distribute by hash(a); 假设agg下层算子所输出结果集的分布列为setA,agg操作的group by列为setB,则在Stream框架下,Agg操作可以分为两个场景。 场景一:setA是setB的一个子集。 对于这种场景,直接对下层结果集进行汇聚的结果就是正确的汇聚结果,上层算子直接使用即可。如下图所示:
PG_TS_TEMPLATE PG_TS_TEMPLATE系统表包含定义文本搜索模板的项。模板是文本搜索字典的类的实现框架。因为模板必须通过C语言级别的函数实现,索引新模板的创建必须由数据库系统管理员创建。 表1 PG_TS_TEMPLATE字段 名字 类型 引用 描述 oid oid
审视和修改表定义 在分布式框架下,数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上,较好的表定义需要满足以下要求: 表数据均匀分布在各个DN上,以防止单个DN对应的存储设备空间不足造成集群有效容量下降。选择合适分布列,避免数据分布倾斜可以实现该点。 表Scan压
PG_TS_TEMPLATE PG_TS_TEMPLATE系统表包含定义文本搜索模板的项。模板是文本搜索字典的类的实现框架。因为模板必须通过C语言级别的函数实现,索引新模板的创建必须由数据库系统管理员创建。 表1 PG_TS_TEMPLATE字段 名字 类型 引用 描述 oid oid
enable_fast_query_shipping=on 控制查询优化器是否使用分布式框架,执行快速执行计划。设置为“on”,表示执行计划在CN和DN上各自生成;设置为“off”,表示使用分布式框架,即执行计划在CN上生成,然后发送到DN中执行。 说明: 如果只需要在当前数据库连接
用户资源监控 在多租户管理的框架下,用户可以通过系统视图PG_TOTAL_USER_RESOURCE_INFO和函数GS_WLM_USER_RESOURCE_INFO实时查询所有用户资源(包括内存,CPU核数,存储空间、临时空间、算子落盘空间和IO)实时使用情况,也可以使用系统表
报告和分析,对于大量数据的读(一般是复杂的只读类型查询)支持不足。GaussDB(DWS)利用多节点的规模和资源并使用各种优化法(列存,向量引擎,分布式框架等),专注于联机分析处理(OLAP),为传统数据库对大型数据集的分析及报告工作负荷提供了数量级改善。 当您的数据及查询的复杂性增加时,或者
资源池资源监控 简介 多租户管理框架下,用户关联资源池执行查询,用户执行查询所占用的资源将汇总至关联资源池上,通过资源池监控视图,用户可以直观的查询到所有资源池的实时资源使用情况,同时也可以通过资源池监控历史表查询资源池资源的历史使用情况。 资源池监控数据每5s更新一次,但是因为
用户资源监控 在多租户管理的框架下,用户可以通过系统视图PG_TOTAL_USER_RESOURCE_INFO、PGXC_TOTAL_USER_RESOURCE_INFO和函数GS_WLM_USER_RESOURCE_INFO实时查询所有用户资源(包括内存,CPU核数,存储空间、
资源池资源监控 简介 多租户管理框架下,用户关联资源池执行查询,用户执行查询所占用的资源将汇总至关联资源池上,通过资源池监控视图,用户可以直观的查询到所有资源池的实时资源使用情况,同时也可以通过资源池监控历史表查询资源池资源的历史使用情况。 资源池监控数据每5s更新一次,但是因为