检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
词典测试 函数ts_lexize用于进行词典测试。 ts_lexize(dict regdictionary, token text) returns text[]如果输入的token可以被词典识别,那么ts_lexize返回词素的数组;如果token可以被词典识别但它是一个停用词
MaxWords,MinWords:定义摘录的最长和最短值。 ShortWord:在摘录的开始和结束会丢弃此长度或更短的词。默认值3会消除常见的英语冠词。 HighlightAll:布尔标志。如果为真,整个文档将作为摘录。忽略前面三个参数的值。
创建数据仓库GaussDB(DWS) 参见“创建集群”章节创建GaussDB(DWS)数据仓库。创建成功后,记录集群的内网IP。 为确保ECS与GaussDB(DWS)网络互通,GaussDB(DWS)数据仓库需要与ECS在同一个区域,同一个虚拟私有云和子网下。 表1 DWS规格
然而,停用词影响tsvector中的位置,同时位置也会影响相关度: 1 2 3 4 SELECT to_tsvector('english','in the list of stop words'); to_tsvector --------------------
然而,停用词影响tsvector中的位置,同时位置也会影响相关度: 1 2 3 4 SELECT to_tsvector('english','in the list of stop words'); to_tsvector --------------------
通过编写shell脚本自动化执行查询和结果收集 登录ECS,进入到/opt目录下,使用vim命令生成query.conf和run_query.sh两个脚本文件。脚本内容如下,编辑后按:wq!保存脚本配置。 run_query.sh脚本如下: 1 2 3 4 5 6 7
MaxWords,MinWords:定义摘录的最长和最短值。 ShortWord:在摘录的开始和结束会丢弃此长度或更短的词。默认值为3会消除常见的英语冠词。 HighlightAll:布尔标志。如果为true,则整个文档将作为摘录,忽略前面三个参数的值。
创建弹性云服务器ECS 参考《弹性云服务器用户指南》创建弹性云服务器,创建的规格可参见下表。 由于TPC-DS、TPC-H数据集占用空间较大,以TPC-DS 1000X和TPC-H 1000X为例,分别占用930GB和1100GB。请创建弹性云服务器时,根据需求添加数据盘,举例如下
database_name 是 String 数据库名称。 表2 Query参数 参数 是否必选 参数类型 描述 sort_key 否 String 排序字段。 sort_dir 否 String 排序规则。 keywords 否 String 查询关键词。
SNAP_GLOBAL_STAT_DATABASE SNAP_PGXC_REDO_STAT SNAP_GLOBAL_REDO_STAT SNAP_PGXC_REL_IOSTAT SNAP_GLOBAL_REL_IOSTAT SNAP_PGXC_TOTAL_MEMORY_DETAIL
SNAP_GLOBAL_STAT_DATABASE SNAP_PGXC_REDO_STAT SNAP_GLOBAL_REDO_STAT SNAP_PGXC_REL_IOSTAT SNAP_GLOBAL_REL_IOSTAT SNAP_PGXC_TOTAL_MEMORY_DETAIL
分词器测试 函数ts_debug允许简单测试文本搜索分词器。 1 2 3 4 5 6 7 8 ts_debug([ config regconfig, ] document text, OUT alias text, OUT description
解析器测试 函数ts_parse可以直接测试文本搜索解析器。 1 2 ts_parse(parser_name text, document text, OUT tokid integer, OUT token text) returns setof record
集群性能分析 GaussDB(DWS)不同集群规格的CPU核数、内存大小和节点存储容量不同,处理业务能力和性能也就不同,用户在创建集群前需要结合实际业务量和具体使用场景来选择集群规格。 在使用集群过程中,当用户的业务量过大,则需要更多的资源(CPU、内存、网络带宽等)来支撑逐渐增长的业务量
解析器测试 函数ts_parse可以直接测试文本搜索解析器。 1 2 ts_parse(parser_name text, document text, OUT tokid integer, OUT token text) returns setof record
性能调优 基于表结构设计和调优提升GaussDB(DWS)查询性能 分析正在执行的SQL以处理GaussDB(DWS)业务阻塞
集群性能分析 GaussDB(DWS)不同集群规格的CPU核数、内存大小和节点存储容量不同,处理业务能力和性能也就不同,用户在创建集群前需要结合实际业务量和具体使用场景来选择集群规格。 在使用集群过程中,当用户的业务量过大,则需要更多的资源(CPU、内存、网络带宽等)来支撑逐渐增长的业务量
调优前:学习表结构设计 在本实践中,您将学习如何优化表的设计。您首先不指定存储方式,分布键、分布方式和压缩方式创建表,然后为这些表加载测试数据并测试系统性能。接下来,您将应用调优表实践以使用新的存储方式、分布键、分布方式和压缩方式重新创建这些表,并再次为这些表加载测试数据和测试系统性能
1 ALTER TEXT SEARCH DICTIONARY my_dict ( Language = dutch, StopWords ); 更新词典定义,不实际更改任何内容。
分词器测试 函数ts_debug允许简单测试文本搜索分词器。 1 2 3 4 5 6 7 8 ts_debug([ config regconfig, ] document text, OUT alias text, OUT description