检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
实现数据列的加解密 数据加密作为有效防止未授权访问和防护数据泄露的技术,在各种信息系统中广泛使用。作为信息系统的核心,GaussDB(DWS)数仓也提供数据加密功能,包括透明加密和使用SQL函数加密。本章节主要讨论SQL函数加密。 GaussDB(DWS)目前不支持从Oracle
分析函数 在Teradata中,分析函数统称为有序分析函数,它们为数据挖掘、分析和商业智能提供了强大的分析能力。 ORDER BY中的分析函数 输入:ORDER BY子句中的分析函数 1 2 3 4 SELECT customer_id, customer_name, RANK(customer_id
创建SSB数据集的GDS外表 连接DWS数据库后执行以下SQL语句。 以下每个外表的“gsfs://192.168.0.90:500x/xxx | gsfs://192.168.0.90:500x/xxx”中的IP地址和端口,请替换成安装和启动GDS中的对应的GDS的监听IP和端口。
息均在DN上记录,且统计数值反应的是整个查询执行过程中的行活动,包括对相关系统表、元数据表、数据表等做必要的扫描和修改,与对应数据量以及相关参数设置相关,即统计数值将会大于等于对实际数据表的扫描和修改。 时间分布,包含:DB_TIME/CPU_TIME/EXECUTION_TIM
息均在DN上记录,且统计数值反应的是整个查询执行过程中的行活动,包括对相关系统表、元数据表、数据表等做必要的扫描和修改,与对应数据量以及相关参数设置相关,即统计数值将会大于等于对实际数据表的扫描和修改。 时间分布,包含:DB_TIME/CPU_TIME/EXECUTION_TIM
如果表达式列表中的所有表达式都等于NULL,则本函数返回NULL。 它常用于在显示数据时用缺省值替换NULL。 和CASE表达式一样,COALESCE不会计算不需要用来判断结果的参数;即在第一个非空参数右边的参数不会被计算。 decode(base_expr, compare1, value1
ata的元数据和数据的缓存,元数据缓存大小为cstore_buffers的1/4,最大不超过2GB,其余缓存空间为列存数据和外表列存格式数据共享使用。 dfs_max_memory 参数说明:设置orc导出时能占用的最大内存。如果导出大宽表时出现内存不足问题,可以调大此参数后重试。该参数仅8
命令中的斜体部分请根据实际填写,如果数据分片存放至多个数据盘目录,需要启动对应目录数量的GDS。 如果TPC-H和TPC-DS数据同时测试,需要启动以上4个GDS,如果只测试TPC-DS或TPC-H数据,请根据后面的“#xxx”备注启动对应的GDS服务即可。 -d dir:保存有待导入数据的数据文件所在目录。
通过视图管控数据权限 本章节介绍如何通过视图实现给不同的用户授予查询同一表中不同数据的权限,提供数据的权限管理和安全性。 场景 dbadmin用户连接集群后,创建示例表customer: 1 CREATE TABLE customer (id bigserial NOT NULL
定。该索引将在创建索引表的模式中自动创建。 图1 输入:索引 图2 输出:索引 输入:基于CASE函数的索引 函数索引是基于列函数或表达式计算结果创建的索引。 输入 1 2 3 4 5 6 7 8 9 CREATE UNIQUE index GCC_RSRC_ASSIGN_U1
tream*comm_max_datanode),若并发数据流数过大,查询较为复杂及smp过大都会导致内存不足。 如果comm_max_datanode参数值较小,进程内存充足,可以适当将comm_max_stream值调大。 max_stream_pool 参数说明:设置str
YY014 错误原因:GTM发生故障或者CN与GTM断连,导致CN上的活跃事务在GTM上丢失,DN上OldestXmin计算偏大,集群中CN活跃事务需要访问的数据被清除。 解决办法:重新执行失败SQL,如果执行失败,请联系技术支持工程师提供技术支持。 父主题: GAUSS-05901
配置DWS数据源连接 参见创建CDM集群先完成CDM集群创建并绑定弹性IP。 确保CDM集群与DWS集群在同一个区域、虚拟私有云下,以保证网络互通。 在CDM管理控制台的“集群管理”页面,单击集群操作列的“作业管理”,选择“连接管理 > 新建连接”。 连接器类型选择“数据仓库服务(DWS)”,单击“下一步”。
易导致结果集膨胀,造成性能和资源过载风险。 方案建议: 多表关联时明确每张表的过滤条件和关联条件,避免出现缺少过滤条件和关联条件的情况。 规则3.9 多表关联字段数据类型要保持一致 违反规范的影响: 关联字段类型不一致,导致额外的类型转换开销,且影响数据重分布的策略,无法生成最优计划。
如何删除DWS重复的表数据? 清理数据库脏数据时,可能会有多条重复数据只保留一条的场景,此场景可以使用聚合函数或窗口函数来实现。 构建表数据 创建表t_customer,向表中插入包含重复记录的数据: 1 2 3 4 5 6 7 8 9 10 11 12 13 14
使用GaussDB(DWS) Turbo引擎提升数据查询性能 场景介绍 Turbo向量化引擎是一种高性能的数据处理引擎,它采用向量化技术来显著提升数据处理的效率和速度,它是基于传统列存执行引擎的主要性能瓶颈点做出的独创性突破,通过数据格式优化、自研Hash算法、根据运行态数据特征定制数据处理算法、算子算法重构等手段实现性能倍增目标。
在此表上表启动的顺序扫描的次数。 seq_tup_read bigint 顺序扫描抓取的有live数据行的数目。 idx_scan bigint 索引扫描的次数。 idx_tup_fetch bigint 索引扫描抓取的有live数据行的数目。 n_tup_ins bigint 插入的行数。 n_tup_upd
易导致结果集膨胀,造成性能和资源过载风险。 方案建议: 多表关联时明确每张表的过滤条件和关联条件,避免出现缺少过滤条件和关联条件的情况。 规则3.9 多表关联字段数据类型要保持一致 违反规范的影响: 关联字段类型不一致,导致额外的类型转换开销,且影响数据重分布的策略,无法生成最优计划。
13 15 17 19 (10 rows) rb_and_agg(roaringbitmap) 描述:将分组内的roaringbitmap数据按照交的操作聚合成一个roaringbitmap集合。 示例: 1 2 3 4 5 6 7 8 9 10 11 12 13
系统信息函数 会话信息函数 访问权限查询函数 模式可见性查询函数 系统表信息函数 系统函数信息函数 注释信息函数 事务ID和快照 计算子集群函数 锁信息函数 父主题: 函数和操作符