-
数组函数 - 数据仓库服务 GaussDB(DWS)
1 2 (2 rows) unnest函数配合string_to_array数组使用。数组转列,先将字符串按逗号分割成数组,然后再把数组转成列: 1 2 3 4 5 6 7 8 SELECT unnest(string_to_array('a,b,c,d'
-
gds - 数据仓库服务 GaussDB(DWS)
gds_ctl.py 背景信息 在配置了gds.conf的情况下,就可通过gds_ctl.py控制gds的启动和停止。 前置条件 只支持在Linux系统执行该命令。执行前,需确保目录结构如下: |----gds |----gds_ctl.py |----config |-------gds
-
向量化执行和行列混合引擎 - 数据仓库服务 GaussDB(DWS)
向量化执行和行列混合引擎 技术背景 在大宽表,数据量比较大、查询经常关注某些列的场景中,行存储引擎查询性能比较差。例如气象局的场景,单表有200~800个列,查询经常访问10个列,在类似这样的场景下,向量化执行技术和列存储引擎可以极大的提升性能和减少存储空间。 向量化执行 标准的
-
执行导入数据 - 数据仓库服务 GaussDB(DWS)
执行导入数据 背景信息 在执行数据导入前,您可以参考以下优秀实践方法进行合理的设计部署,最大化的使用系统资源,以提高数据导入性能。 OBS的数据导入性能,多数场景受限于网络的并发访问速率,因此在OBS服务器上最好部署多个桶,使用多桶并发导入,提高DN数据传输利用率。 并发导入场景
-
SMP适用场景与限制 - 数据仓库服务 GaussDB(DWS)
SMP适用场景与限制 背景信息 SMP特性通过算子并行来提升性能,同时会占用更多的系统资源,包括CPU、内存、网络、I/O等等。本质上SMP是一种以资源换取时间的方式,在合适的场景以及资源充足的情况下,能够起到较好的性能提升效果;但是如果在不合适的场景下,或者资源不足的情况下,反
-
数组函数 - 数据仓库服务 GaussDB(DWS)
1 2 (2 rows) unnest函数配合string_to_array数组使用。数组转列,先将字符串按逗号分割成数组,然后再把数组转成列: 1 2 3 4 5 6 7 8 SELECT unnest(string_to_array('a,b,c,d'
-
事务管理 - 数据仓库服务 GaussDB(DWS)
由一个有限的数据库操作序列构成(通常由事务开始与事务结束之间执行的全部数据库操作组成),这些操作要么全部执行,要么全部不执行,是一个不可分割的执行单位。 事务的作用 数据库事务的目的主要是: 为数据库操作序列提供了一个从失败中恢复到正常状态的方法,同时提供了数据库即使在异常状态下仍能保持一致性的方法。
-
事务管理 - 数据仓库服务 GaussDB(DWS)
由一个有限的数据库操作序列构成(通常由事务开始与事务结束之间执行的全部数据库操作组成),这些操作要么全部执行,要么全部不执行,是一个不可分割的执行单位。 事务的作用 数据库事务的目的主要是: 为数据库操作序列提供了一个从失败中恢复到正常状态的方法,同时提供了数据库即使在异常状态下仍能保持一致性的方法。
-
配置JDBC连接(使用负载均衡方式) - 数据仓库服务 GaussDB(DWS)
配置JDBC连接(使用负载均衡方式) 背景信息 很多用户在使用JDBC连接集群时只连接集群的一个CN,这就导致单个CN压力较大并且别的CN资源浪费,并且这种方式还有单点故障导致连接不可用的风险。 用户可使用JDBC连接多个CN避免以上问题。主要有以下两种方式: 使用ELB连接集群
-
SQL自诊断 - 数据仓库服务 GaussDB(DWS)
SQL自诊断 技术背景 业务中包含大量查询,这些查询在执行计划、执行层面有什么样的问题,比如估算是否不准确、是否存在数据倾斜、是否存在统计信息未收集并且如何收集统计信息等。SQL自诊断为用户提供了一种更为高效易用的性能问题定位方法。主要帮助用户对批处理作业的SQL调优过程进行简化
-
文本搜索解析器 - 数据仓库服务 GaussDB(DWS)
U 助词 V 动词 W 标点符号 X 未知词 Y 语气词 Z 状态词 Pound是一种固定格式分词方法,适用于无语意但待解析文本以固定分隔符分割开来的中英文分词场景。支持中文编码包括GBK、UTF8,支持英文编码包括ASCII。内置6种token类型,如表4 token类型所示;支
-
只读用户配置权限 - 数据仓库服务 GaussDB(DWS)
只读用户配置权限 背景信息 如果您需要对华为云上的GaussDB(DWS)资源,为企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户
-
内存 - 数据仓库服务 GaussDB(DWS)
起内存分配不足。 max_stack_depth 参数说明:设置GaussDB(DWS)执行堆栈的最大安全深度。需要这个安全界限是因为在服务器里,并非所有程序都检查了堆栈深度,只是在可能递规的过程,比如表达式计算这样的过程里面才进行检查。 参数类型:SUSET 设置原则: 此参数
-
gds - 数据仓库服务 GaussDB(DWS)
gds_check 背景信息 gds_check用于对GDS部署环境进行检查,包括操作系统参数、网络环境、磁盘占用情况等,也支持对可修复系统参数的修复校正,有助于在部署运行GDS时提前发现潜在问题,提高执行成功率。 注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数
-
表诊断 - 数据仓库服务 GaussDB(DWS)
表倾斜率和脏页率数据采集周期可在集群监控采集页面进行配置, 过于频繁的采集可能对集群性能有一定影响,请根据集群业务运行情况选择合适的采集周期。 表倾斜率 背景信息 不合理的分布列选择,将引发算子计算/数据下盘倾斜严重,导致不同DN的处理压力不同,影响业务性能,并容易造成单DN磁盘使用率过高。用户
-
ALTER TABLE PARTITION - 数据仓库服务 GaussDB(DWS)
INDEXES; split_clause子句用于把一个分区切割成多个分区。 将范围分区表customer_address的P6分区以1200为分割点切分: 1 ALTER TABLE customer_address SPLIT PARTITION P6 AT(1200) INTO (PARTITION
-
使用场景 - 数据仓库服务 GaussDB(DWS)
使用场景 背景 目前在互联网、教育、游戏等行业都有实时精准营销的需求。通过系统生成用户画像,在营销时通过条件组合筛选用户,快速提取目标群体。例如: 在电商行业中,商家在进行营销活动前,需要根据活动的目的,圈选一批满足特定特征的目标用户群体进行广告推送。 在教育行业中,需要根据学生
-
更新统计信息 - 数据仓库服务 GaussDB(DWS)
更新统计信息 在数据库中,统计信息是规划器生成计划的源数据。没有收集统计信息或者统计信息陈旧往往会造成执行计划严重劣化,从而导致性能问题。 背景信息 ANALYZE语句可收集与数据库中表内容相关的统计信息,统计结果存储在系统表PG_STATISTIC中。查询优化器会使用这些统计数据,以生成最有效的执行计划。
-
使用场景 - 数据仓库服务 GaussDB(DWS)
使用场景 背景 目前在互联网、教育、游戏等行业都有实时精准营销的需求。通过系统生成用户画像,在营销时通过条件组合筛选用户,快速提取目标群体。例如: 在电商行业中,商家在进行营销活动前,需要根据活动的目的,圈选一批满足特定特征的目标用户群体进行广告推送。 在教育行业中,需要根据学生
-
管理运维计划 - 数据仓库服务 GaussDB(DWS)
用户表VacuumFull 优先Vacuum目标 用户可配置优先Vacuum目标,其中一行对应一张表,每张表以数据库名、模式名、表名表示,以空格进行分割。 - 高级配置 选择“自定义”时,可以设置Vacuum膨胀率和目标表可回收空间高级配置参数(满足其中一个条件即触发自动Vacuum),如