检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
BY HASH (Column_Name)的表。 对于Hash分布表而言,在存储表数据时,采用的是散列(Hash)方式的存储原理,如图1所示,图中以将表(T2)导出到OBS为例。 在存储表数据时,将表(T2)中指定的Hash字段(col2)进行Hash运算后,生成相应的Hash值(v
容错性 当数据库系统发生错误时,以下参数控制服务器处理错误的方式。 exit_on_error 参数说明:控制终止会话。 参数类型:SUSET 取值范围:布尔型 on表示任何错误都会终止当前的会话。 off表示只有FATAL级别的错误才会终止会话。 默认值:off omit_encoding_error
列存表更新失败或多次更新后出现表膨胀 问题现象 对列存表更新或UPDATE会失败。 多次对列存表UPDATE,发现表大小膨胀了十多倍。 原因分析 列存表不支持并发更新。 列存表的更新操作,空间不会回收旧记录。 处理方法 方法一 该处理方法仅8.1.3及以上集群版本支持。 登录GaussDB(DWS)
由于DWS的表定义结构与Oracle存在差异,需要手动修改转换后的表定义。 如下,将文件中的\echo整体注释掉(如果使用gsql工具导入表定义的话,不需要注释),同时手动修改指定表的分布列(distribute by hash (列名))。 修改前: 修改后: Hash分布表的分布列选取至关重要,需要满足以下原则:
级别的信息。特殊级别的错误信息是否报告到客户端、写到服务器日志由log_min_messages和client_min_messages这两个配置参数控制。 format:格式字符串,指定要报告的错误消息文本。格式字符串后可跟表达式,用于向消息文本中插入。在格式字符串中,%由fo
级别的信息。特殊级别的错误信息是否报告到客户端、写到服务器日志由log_min_messages和client_min_messages这两个配置参数控制。 format:格式字符串,指定要报告的错误消息文本。格式字符串后可跟表达式,用于向消息文本中插入。在格式字符串中,%由fo
编辑input/check_input.xlsx文件: 复制check_input.xlsx文件到windows服务器,使用Excel软件编辑,填写要校验的表信息,保存后,上传到Linux服务器覆盖原始的文件。 执行数据校验工具 : 进入bin目录,执行启动脚本sh datacheck.sh 查看校验结果
其他模块 巡检 支持(单机版不支持) 支持 智能运维 支持(单机版不支持) 支持 节点修复 支持(单机版不支持) 支持 租户侧温备 支持(单机版不支持) 支持 备注1:存算分离表数据存储在OBS上,无需重分布,但是元数据和索引存储在本地,仍然需要进行重分布。存算分离表在重分布时,
S)自身支持的数据类型存在差异,在创建外表定义表字段时,您需要了解这两者之间数据类型的对应关系,具体如表1所示: 表1 数据类型匹配表 类型名称 GaussDB(DWS)的HDFS/OBS外表支持的字段类型 Hive表字段类型 Spark表字段类型 2字节整数 SMALLINT SMALLINT
用于索引表达式。 SQL被大多数数据库用作查询语言。它是可移植的并且容易学习。但是每一个SQL语句必须由数据库服务器单独执行。 这意味着客户端应用必须发送每一个查询到数据库服务器、等待它被处理、接收并处理结果、做一些计算,然后发送更多查询给服务器。如果客户端和数据库服务器不在同一
集群管理”页面的集群列表中,单击指定集群的名称,再选择“集群详情”页签,可查看集群版本。 解压下载的客户端软件包(32位或64位)到需要安装的路径。 打开安装目录,双击Data Studio.exe,启动Data Studio客户端。 图2 启动客户端 表1 Data Studio安装包结构
PGXC_NODE PLAN_TABLE_DATA SNAPSHOT TABLES_SNAP_TIMESTAMP 性能视图快照系统表 父主题: GaussDB(DWS)系统表和系统视图
区大小。 如果导入表存在索引,在数据导入过程中,将增量更新索引信息,影响数据导入性能。建议在执行数据导入前,先删除相关表的索引。在数据导入完成后,再重新创建索引。 操作步骤 在GaussDB(DWS)数据库中,创建目标表,用于存储从OBS导入的数据。 目标表的表结构和OBS上将要
exchange/truncate/drop partition操作对表数据改动的时间。 参数类型:USERSET 取值范围:布尔型 on表示允许收集相关操作对表数据改动的时间。 off表示禁止收集相关操作对表数据改动的时间。 默认值:on instr_unique_sql_count
用于索引表达式。 SQL被大多数数据库用作查询语言。它是可移植的并且容易学习。但是每一个SQL语句必须由数据库服务器单独执行。 这意味着客户端应用必须发送每一个查询到数据库服务器、等待它被处理、接收并处理结果、做一些计算,然后发送更多查询给服务器。如果客户端和数据库服务器不在同一
下载并安装DSC 在使用DSC工具之前,必须在Linux或Windows服务器中安装工具,DSC支持Linux 64位操作系统。DSC支持其它操作系统的详情请见表4。 前提条件 在Linux系统中请勿使用具有root权限的用户安装和操作DSC。且该用户必须具有创建文件夹的权限,否则install
partition操作对表数据改动的时间。 参数类型:USERSET 取值范围:布尔型 on表示允许收集相关操作对表数据改动的时间。 off表示禁止收集相关操作对表数据改动的时间。 默认值:on enable_save_dataaccess_timestamp 参数说明:控制是否记录表的最后一次访问时间。该参数仅8
步骤3:调优表操作具体步骤 选择存储方式 此实践中所使用的样例表为典型的TPC-DS表,是典型的多字段表,统计分析类查询场景多,因此选择列存存储方式。 1 WITH (ORIENTATION = column) 选择压缩级别 在步骤1:创建初始表并加装样例数据中没有指定压缩比,
问该schema下的表。 原因分析 将模式中的表或者视图对象授权给其他用户时,需要将表或视图所属的模式的USAGE权限同时授予该用户,如果没有该权限,则只能看到这些对象的名字,并不能实际进行对象访问。 如果要将该schema下未来创建的表的权限也赋予u1用户,则需使用ALTER DEFAULT
极易引起混合编码问题。GDS导出时保证外表的字符集和客户端字符集一致即可,导入时保证客户端编码,数据文件内容编码和客户端一致。 如果存在无法变更数据库,客户端,外表字符集时,可以尝试使用iconv命令进行手动转换。 1 2 #注意 -f 表示源文件的字符集,-t为目标字符集 iconv