检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
“foldername”:必选参数。数据源文件的OBS路径,此处仅需要填写“/桶名/文件夹目录层级/”。 可以先通过OBS上的数据准备中的2获取数据源文件的完整的OBS路径,该路径为OBS服务的终端节点(Endpoint)。 “totalrows”:可选参数。该参数不是导入的总行数
流程供您参考。 准备环境 已创建3.0 DWS集群,需确保MRS和DWS集群在同一个区域、可用区、同一VPC子网内,确保集群网络互通。 已获取华为云账户的AK和SK。 约束与限制 目前仅支持对接EXTERNAL SCHEMA对应的Hive端数据库的表进行SELECT、INSERT和INSERT
多个路径用', '分隔。 查询分区表时,会先根据分区信息进行剪枝,然后查询满足条件的数据文件。由于剪枝操作会涉及多次扫描HDFS分区目录内容,不建议使用重复度非常小的列作为分区列,因为这可能导致分区目录非常的多,增加对HDFS的查询压力。 OBS只读外表和读写外表不支持。 delimiter
类型间进行匹配,匹配状况如表1所示。同理,GaussDB(DWS)可通过只写外表将数据导出存储为ORC文件格式,使用HIVE读取ORC文件内容,相互之间也需要类型匹配,匹配状况如表2所示: 表1 ORC格式的只读外表与HIVE数据类型匹配关系 类型名称 GaussDB(DWS)外表支持类型
CREATE TEXT SEARCH CONFIGURATION 创建Synonym词典。 假设同义词词典定义文件pg_dict.syn内容如下: 1 2 3 postgres pg pgsql pg postgresql pg 执行如下语句创建Synonym词典:
log。 1MB - 10MB 5MB log-file-size=10MB migrate-executequery 指定是否迁移包含SQL内容的execute_query。 设为true,表示迁移。 设为false,表示不迁移。 示例: 设为true时,将 1 2 my $row
避免使用自增列或自增数据类型 违反规范的影响: 自增序列或自增数据类型在大量使用时,会造成GTM压力过大及序列生成速度慢。 方案建议: 如果只是想获取一个唯一标识,可以使用UUID。 如果必须使用自增序列,在没有严格递增的需求,可设置CACHE,比如1000,降低GTM压力。 父主题: GaussDB(DWS)对象设计规范
避免使用自增列或自增数据类型 违反规范的影响: 自增序列或自增数据类型在大量使用时,会造成GTM压力过大及序列生成速度慢。 方案建议: 如果只是想获取一个唯一标识,可以使用UUID。 如果必须使用自增序列,在没有严格递增的需求,可设置CACHE,比如1000,降低GTM压力。 父主题: GaussDB(DWS)对象设计规范
teid NOT IN (SELECT teid FROM course ); ANY/SOME 示例 左侧主句与右侧子查询进行字段比对,获取需要的结果集: 1 SELECT * FROM course WHERE teid < ANY (SELECT teid FROM teacher
计的数据和所有相关的索引和压缩表的尺寸。 pg_obs_file_size(regclass) 描述:指定列存V3版本表OID或者表名字,获取其在OBS上存储的CU文件大小、文件名、bucket号。该函数仅9.1.0及以上集群版本支持。 参数:入参可以是表的OID或者表名。 返回值类型:record
对应GaussDB(DWS)数据库server名称,包含小写字母、数字或者下划线,且必须以小写字母开头,长度为3到63个字符。 配置方式 表示配置时系统获取文件使用的方式: MRS用户:配置MRS manager用户/密码,系统登录MRS manager自动下载配置文件及认证文件。参数说明详情请参见表2。
teid NOT IN (SELECT teid FROM course ); ANY/SOME 示例 左侧主句与右侧子查询进行字段比对,获取需要的结果集: 1 SELECT * FROM course WHERE teid < ANY (SELECT teid FROM teacher
所有epoch的非最后一个文件,清理当前epoch的最后一个文件,清理小于当前epoch的最后一个文件。若检查为跨VW写的场景,CN节点会获取所有DN节点的epoch信息包装成epochList下发给元数据VW,v3表vacuum会清理所有epoch的非最后一个文件,清理小于ma
选择最合适的查询规划,一般来说通过ANALYZE语法收集整个表或者表的若干个字段的统计信息,周期性地运行ANALYZE,或者在对表的大部分内容做了更改之后马上运行它是个好习惯。 调优手段之GUC参数 查询优化的主要目的是为查询语句选择高效的执行方式。 如下SQL语句: 1 2 SELECT
STORAGE_PARAMETER = value } [, ...] ) 改变索引的一个或多个索引方法特定的存储参数。 需要注意的是索引内容不会被这个命令立即修改,根据参数的不同,可能需要使用REINDEX重建索引来获得期望的效果。 RESET ( { storage_parameter
在教育行业中,需要根据学生不同的特征,推送有针对性的练习题目,帮助学生查漏补缺。 在搜索、视频、门户网站中,根据用户关注的热点,推送不同的内容。 这些业务场景都有一些共同的特点: 数据量庞大,运算量极大。 用户规模庞大,标签多,字段多,占用存储空间也多。 圈选的特征条件多样化,很
选择最合适的查询规划,一般来说通过ANALYZE语法收集整个表或者表的若干个字段的统计信息,周期性地运行ANALYZE,或者在对表的大部分内容做了更改之后马上运行它是个好习惯。 调优手段之GUC参数 查询优化的主要目的是为查询语句选择高效的执行方式。 如下SQL语句: 1 2 SELECT
否则输入字符串将在每个分隔字符串处分开。 在string_to_array中,如果省略null字符串参数或为NULL,将字符串中没有输入内容的子串替换为NULL。 unnest(anyarray) 描述:扩大一个数组为一组行。 返回类型:setof anyelement 示例:
前面加一个反斜杠。任何包含在单引号里的内容都会被进一步进行类似C语言的替换:\n(新行)、\t(制表符)、\b(退格)、\r(回车)、\f(换页)、\digits(八进制表示的字符)、\xdigits(十六进制表示的字符)。 用""包围的内容被当做一个命令行传入shell。该命令
在教育行业中,需要根据学生不同的特征,推送有针对性的练习题目,帮助学生查漏补缺。 在搜索、视频、门户网站中,根据用户关注的热点,推送不同的内容。 这些业务场景都有一些共同的特点: 数据量庞大,运算量极大。 用户规模庞大,标签多,字段多,占用存储空间也多。 圈选的特征条件多样化,很