检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据读取 单表查询 多表连接查询 WITH表达式 跨逻辑集群数据读写
-------------------------------------------- SET search_path = tpchobs; + CREATE TABLE
以下两种行为: 业务报错:unable to get a stable set of rows in the source table. 随机匹配一行数据,可能会导致实际与预期不符。 原因分析 进行MERGE INTO操作对目标表做更新或插入,目标表匹配到多行满足条件时出现该报错。
Key,简称PCK),列存储下一种通过min/max稀疏索引实现基表快速扫描的索引技术。Partial Cluster Key可以指定多列,但是一般不建议超过2列。PCK适用于列存大表点查询加速。 优化前 创建一个无局部聚簇(以下称为PCK)的列存表orders_no_pck,表定义如下: 执行以下SQL语句,查询某个点查询的执行计划:
GAUSS-01878: "invalid privilege type %s for column" SQLSTATE: 0LP01 错误原因:该权限类型不适用于列属性。 解决办法:检查上下文中关于权限类型的说明以及对象类型的说明。 GAUSS-01879: "language '%s' is not
通过外表查询OBS上的数据 直接查询外表查看OBS上的数据 如果数据量较少,可直接使用SELECT查询外表,即可查看到OBS上的数据。 执行以下命令,则可以从外表查询数据。 1 SELECT * FROM product_info_ext_obs; 查询结果显示与原始数据显示相
SHOW_TSC_INFO 用于查看当前节点TSC换算信息。 2 SHOW_ALL_TSC_INFO 用于查看所有节点TSC换算信息。 3 GET_TSC_INFO 用于重新获取一次当前节点的TSC换算信息,仅用于判断是否稳定,不更新内存信息。 4 GET_ALL_TSC_INFO 用于重新获取一
图1 数据迁移示意图 DRS、CDM、OBS、MRS、DLI为云服务。 GDS、DSC、gs_restore、gs_dump为内部工具。 表1 数据导入方式说明 数据导入方式 数据源 说明 优势 从OBS并行导入数据 OBS 支持将存储在OBS上的TXT、CSV、ORC及CARBO
GS_QUERY_RESOURCE_INFO视图显示当前DN节点所有正在运行作业的资源信息。该参数仅9.1.0及以上集群版本支持。 该视图只能在DN节点上查询。仅适用于运维操作定位问题,不建议用户使用。 表1 GS_QUERY_RESOURCE_INFO 名称 类型 描述 node_name text 实例名称,只包含DN。
option_name ' value ' } [, ...] ) 用于指定外部服务器的各类参数,详细的参数说明如下所示: address 指定的OBS服务终端节点或HDFS集群的IP地址。 OBS:OBS服务的终端节点(Endpoint)。 HDFS:HDFS集群的元数据节点(
GDS是GaussDB(DWS)提供的数据服务工具,通过和外表机制的配合,实现数据的高速导出。 安装配置和启动GDS操作步骤如下,详细内容请参见安装配置和启动GDS。 操作步骤 在使用GDS导入/导出数据前,请先参考教程:使用GDS从远端服务器导入数据中的步骤:“准备ECS作为GDS服务器”、“下载GDS工具包”。
Data_Studio_8.0.x_32.zip Data_Studio_8.0.x_32.zip.sha256 DSC迁移工具 DSC迁移工具适用于GaussDB(DWS) 集群1.7.1及以上版本。 表3 DSC下载地址 适用操作系统 下载地址 校验文件 请参见运行环境 DSC_8.3
Key,简称PCK),列存储下一种通过min/max稀疏索引实现基表快速扫描的索引技术。Partial Cluster Key可以指定多列,但是一般不建议超过2列。PCK适用于列存大表点查询加速。 优化前 创建一个无局部聚簇(以下称为PCK)的列存表orders_no_pck,表定义如下: 执行以下SQL语句,查询某个点查询的执行计划:
Key,简称PCK),列存储下一种通过min/max稀疏索引实现基表快速扫描的索引技术。Partial Cluster Key可以指定多列,但是一般不建议超过2列。PCK适用于列存大表点查询加速。 优化前 创建一个无局部聚簇(以下称为PCK)的列存表orders_no_pck,表定义如下: 执行以下SQL语句,查询某个点查询的执行计划:
参数类型:USERSET 取值范围:浮点型,1.5~2.0 默认值:2 geqo_seed 参数说明:控制GEQO使用的随机数生产器的初始化值,用来从顺序连接在一起的查询空间中查找随机路径。 参数类型:USERSET 取值范围:浮点型,0.0~1.0 不同的值会改变搜索的连接路径,从而影响了所找路径的优劣。
参数类型:USERSET 取值范围:浮点型,1.5~2.0 默认值:2 geqo_seed 参数说明:控制GEQO使用的随机数生产器的初始化值,用来从顺序连接在一起的查询空间中查找随机路径。 参数类型:USERSET 取值范围:浮点型,0.0~1.0 不同的值会改变搜索的连接路径,从而影响了所找路径的优劣。
是存储于外部存储服务中。 表5 外表定义相关SQL 功能 相关SQL 创建GDS外表 CREATE FOREIGN TABLE (GDS导入导出) 创建HDFS或OBS外表(需手动创建Server) CREATE FOREIGN TABLE (SQL on OBS or Hadoop)
customer_address_ext用于接收数据服务器上的数据。 假设OBS数据服务器与集群网络连接正常,OBS数据服务器IP为xxx.xxx.x.xx,数据源文件格式为CSV,规划的并行导入与示例保持一致。 其中设置的导入信息如下所示: 由于OBS服务器上的数据源文件存放目录为“/input-data1/data/
该范围类型的元素类型(子类型)的OID。 rngcollation oid PG_COLLATION.oid 用于范围比较的排序规则的OID,如果没有则为0。 rngsubopc oid PG_OPCLASS.oid 用于范围比较的子类型的操作符类的OID。 rngcanonical regproc PG_PROC
target_files 指定要在输出/目标文件中执行的操作。 Overwrite:用于覆盖输出文件夹中的现有文件。 指定是否必须覆盖输出文件夹中的文件。 Delete:用于删除目标文件夹中的所有文件。 Cancel:用于在输出/目标文件夹中存在文件时取消操作。 overwrite delete