检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
除了提高检索质量外,词的规范化和删除停用词可以减少文档tsvector格式的大小, 从而提高性能。词的规范化和删除停用词并不总是具有语言学意义,用户可以根据应用环境在词典定义文件中自定义规范化和删除规则。 一个词典是一个程序,接收标记(token)作为输入,并返回: 如果token在词典中已知,返回对应lexeme
bigint 网络时间,包含CN向客户端发送数据、DN向CN发送数据等时间,单位为微秒。 data_io_time bigint IO时间,文件IO耗时,单位为微秒。 first_time timestamp with time zone 该SQL第一次执行的时间。 last_time
bigint 网络时间,包含CN向客户端发送数据、DN向CN发送数据等时间,单位为微秒。 data_io_time bigint IO时间,文件IO耗时。单位为微秒。 first_time timestamp with time zone 该SQL第一次执行的时间。 last_time
创建外部服务器。 例如,执行以下命令创建外部服务器“obs_server”: 认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 1 2 3 4 5 6 7 8 CREATE SERVER obs_server FOREIGN
connectionMaxIdleMs 连接最大空闲时间(毫秒)。 60000 metadataCacheSeconds 元数据缓存时间(秒),为提升性能,会对理论上不怎么变更的数据,例如表结构,该参数用于设置缓存过期时间。 180 retryBaseTime 重试时sleep时间 = retryBaseTime
可用区和同一个VPC子网下,ECS的操作系统选择与gsql客户端(本例以CentOS 7.6为例),并选择以密码方式登录。 创建集群 登录华为云管理控制台。 在“服务列表”中,选择“大数据 > 数据仓库服务”,单击右上角“创建数据仓库集群”。 参见表1进行参数配置。 表1 软件配置
filename character varying 出现数据格式错误的数据源文件名。 rownum bigint 在数据源文件中,出现数据格式错误的行号。 rawrecord text 在数据源文件中,出现数据格式错误的原始记录。为了防止字段长度过大,限制字段的长度不超过1024
Full操作,否则可能会导致集群只读。 创建快照时因备份数据会降低磁盘I/O性能,建议在业务相对空闲的时期进行快照操作。 快照期间会保留一些中间文件,需额外占用磁盘空间,因此请避开业务高峰期并保证磁盘容量在70%以下。 父主题: 备份与恢复GaussDB(DWS)集群
在普通索引“reasons_idx”。在执行数据导入前,请先删除相关索引。 1 DROP INDEX reasons_idx; 将数据源文件中的数据通过外表“foreign_tpcds_reasons”导入到表“reasons”中。 1 INSERT INTO reasons SELECT
名称 类型 描述 node_name text 节点名称。 io_type char IO类型: 'r'表示读。 'w'表示写。 's'表示文件操作。 current_bps int8 当前带宽速率(KB/s)。 best_bps int8 近期达到过的最佳带宽速率(KB/s)。 waiting_request_num
来以IN到EXISTS的转换为例(同样适用于NOT IN到NOT EXISTS的转换)。 IN到EXISTS的简单转换 在如下示例中,输入文件中提供了关键词IN。为进行优化,该工具在迁移过程中将其替换为EXISTS关键词。 嵌套IN/NOT IN 的IN/NOT IN语句不支持迁移,迁移的脚本将失效。
4,最大不超过2GB,其余缓存空间为列存数据和外表列存格式数据共享使用。 work_mem 设置内部排序操作和Hash表在开始写入临时磁盘文件之前使用的内存大小。 ORDER BY,DISTINCT和merge joins都要用到排序操作。Hash表在散列连接、散列为基础的聚集、散列为基础的IN子查询处理中都要用到。
已保存配置并生效。 此外,单击刷新图标,可刷新配置信息。 查看数据库审计日志方式 方式一:由于审计日志会占用一定磁盘空间,为了防止本地磁盘文件过大,GaussDB(DWS)支持审计日志转储,用户可以开启审计日志转储功能,将审计日志转储到OBS(用户需创建用于存储审计日志的OBS桶
时,允许数据源文件一行中最后若干字段缺失,处理方式是将这些字段设置为NULL。而在此之前,仅允许数据源文件一行中最后一个字段缺失,否则报错。该参数仅8.1.3.336、8.2.1.200、9.1.0.100及以上集群版本支持。 设置此选项时,GDS外表允许数据源文件一行最后多个字段缺失。
hJoin或者HashAgg的下盘文件个数。仅在enable_sonic_hashjoin或enable_sonic_hashagg开启情况下生效。 参数类型:USERSET 取值范围:布尔型 on表示开启下盘文件数优化。 off表示关闭下盘文件数优化。 满足sonic条件下的H
描述:返回当前实例上指定数据库中创建临时文件的个数。 返回值类型:bigint pg_stat_get_db_total_temp_files(oid) 描述:在CN上执行该函数,返回集群中所有DN上指定数据库中创建临时文件的总个数。在DN上执行该函数,返回当前实例上指定数据库中创建临时文件的个数。 返回值类型:bigint
ptions中的参数值。 address 指定HDFS集群的主备节点所在的IP地址以及端口。 hdfscfgpath 指定HDFS集群配置文件路径。该参数仅支持type为HDFS时设置。只能设置一个路径。 type 取值为'hdfs',表示HDFS_FDW连接的是HDFS。 查看外部服务器:
GDS-Kafka支持的消息格式 表2 GDS-Kafka支持的消息格式 kafka.source.event.type 格式示例 格式说明 cdc.drs.avro 华为云DRS的内部格式,DRS生产至Kafka的avro格式,GDS-Kafka可直接对接进行解析入库。 无 drs.cdc 使用drs.cd
AULTS元素的列表。 prosrc text 描述函数或存储过程的定义。例如,对于解释型语言来说就是函数的源程序,或者一个链接符号,一个文件名,或者函数和存储过程创建时指定的其他任何函数体内容,具体取决于语言/调用习惯的实现。 probin text 关于如何调用该函数的附加信息。同样,其含义也是和语言相关的。
库性能。 加工RoaringBitmap 访问Maven下载开源的RoaringBitmap的jar包,推荐下载0.9.15版本。 POM文件依赖项配置如下: 1 2 3 4 5 6 7 <dependencies> <dependency> <groupId>org.roa