检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PGXC_WAIT_DETAIL视图显示集群中所有节点SQL的详细等待链信息。该视图仅8.1.3.200及以上集群版本支持。 表1 PGXC_WAIT_DETAIL字段 名称 类型 描述 level integer 等待链中的层级,以1开始,每显示一层等待关系level会加1。 lock_wait_hierarchy
GS_WLM_OPERATOR_STATISTICS视图显示当前用户正在执行的作业的算子相关信息。 表1 GS_WLM_OPERATOR_STATISTICS字段 名称 类型 描述 queryid bigint 语句执行使用的内部query_id。 pid bigint 后端线程ID。 plan_node_id
PGXC_RESPOOL_RESOURCE_HISTORY用于查询所有实例上资源池监控历史信息。 表1 PGXC_RESPOOL_RESOURCE_HISTORY字段 名称 类型 描述 nodename name 实例名称,包含CN和DN。 timestamp timestamp 资源池监控信息持久化时间。 nodegroup
分区表插入数据报错:inserted partition key does not map to any table partition 问题现象 给范围分区表插入数据报错:inserted partition key does not map to any table partition。
在“SQL终端”页签中查看表属性和PL/SQL函数/过程 可在Data Studio中查看表属性和函数/过程。 执行如下步骤查看表属性: 按下Ctrl键,同时将光标移动到表名处。 单击突出显示的表名。Data Studio中显示所选表的属性。 表属性均为只读。 执行如下步骤查看函数/过程:
使用JDBC或ODBC进行GaussDB(DWS)二次开发 开发前准备 基于JDBC开发 基于ODBC开发
SQL调优流程 对慢SQL语句进行分析,通常包括以下步骤: 操作步骤 收集SQL中涉及到的所有表的统计信息。在数据库中,统计信息是规划器生成计划的源数据。没有收集统计信息或者统计信息陈旧会造成执行计划严重劣化,从而导致性能问题。从经验数据来看,10%左右性能问题是因为没有收集统计信息。具体请参见更新统计信息。
游标概述 为了处理SQL语句,存储过程进程分配一段内存区域来保存上下文联系。游标是指向上下文区域的句柄或指针。借助游标,存储过程可以控制上下文区域的变化。 当游标作为存储过程的返回值时,如果使用JDBC调用该存储过程,返回的游标将不可用。 游标的使用分为显式游标和隐式游标。对于不
GaussDB(DWS)存储过程高级包 DBMS_LOB DBMS_RANDOM DBMS_OUTPUT UTL_RAW DBMS_JOB DBMS_SQL 父主题: GaussDB(DWS)存储过程
运行时统计 查询和索引统计收集器 性能统计 父主题: GaussDB(DWS)数据库GUC参数
更新统计信息 在数据库中,统计信息是规划器生成计划的源数据。没有收集统计信息或者统计信息陈旧会造成执行计划严重劣化,从而导致性能问题。 背景信息 ANALYZE语句可收集与数据库中表内容相关的统计信息,统计结果存储在系统表PG_STATISTIC中。查询优化器会使用这些统计数据,以生成最有效的执行计划。
SQL调优进阶 SQL自诊断 语句下推调优 子查询调优 统计信息调优 算子级调优 数据倾斜调优 SQL语句改写规则 优化器参数调整 父主题: SQL调优
映射管理 映射概述 在开始创建作业任务之前,还需要创建表结构映射,对应源端与目的端的数据库表结构,帮助用户更容易针对不同数据库进行数据迁移。 创建表结构映射 登录GaussDB(DWS)控制台。 在左侧导航栏选择“数据 > 数据集成 > 映射管理”,进入映射管理页面。 单击“创建表映射配置”,进入创建表映射配置页面。
创建GDS外表并导入TPC-DS数据 本文介绍如何通过GDS外表导入TPC-DS 1000x数据,表1列出了TPC-DS测试数据集中的表数据行数。 TPC-H请跳过本章节。 表数据行数 表1 TPC-DS 序号 表名 行数 1 customer_address 6,000,000
TPC-DS数据生成 登录ECS云服务器,执行如下命令创建TPC-DS存放目录。 mkdir -p /data1/script/tpcds-kit/tpcds1000X mkdir -p /data2/script/tpcds-kit/tpcds1000X 从官网获取TPC-DS
INSERT操作规范 规则3.3 INSERT多VALUES批插场景使用COPY替代 违反规范的影响: 多VALUES解析耗时、耗资源,入库效率低。 方案建议: 前端使用COPY类接口(如JDBC的CopyManger等)代替INSERT VALUES。 建议3.4 禁止针对普通列存表进行实时INSERT操作
案例:使排序下推 在做场景性能测试时,发现某场景大部分时间是CN端在做window agg,占到总执行时间95%以上,系统资源不能充分利用。研究发现该场景的特点是:将两列分别求sum作为一个子查询,外层对两列的和再求和后做trunc,然后排序。可以尝试将语句改写为子查询,使排序下推。
MRS集群简介 MapReduce服务(MapReduce Service,简称MRS)是一个基于开源Hadoop生态环境而运行的大数据集群,对外提供大容量数据的存储和分析能力,可解决用户的数据存储和处理需求。有关MRS服务的详细信息,请参考《MapReduce服务用户指南》。 用户可以将
GaussDB(DWS)集群已创建MRS数据源连接。 对系统的影响 更新MRS数据源连接时,GaussDB(DWS)集群会自动重启并无法提供服务。 操作步骤 在GaussDB(DWS)管理管制台,选择“集群 > 专属集群”。 在集群列表,单击指定集群的名称,然后单击“MRS数据源”。
审视和修改表定义 在分布式框架下,数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上,较好的表定义需要满足以下要求: 表数据均匀分布在各个DN上,以防止单个DN对应的存储设备空间不足造成集群有效容量下降。选择合适分布列,避免数据分布倾斜可以实现该点。 表Scan压