检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
词典 词典概述 停用词 Simple词典 Synonym词典 Thesaurus词典 Ispell词典 Snowball词典 父主题: 全文检索
Snowball词典 Snowball词典模板支持词干分析词典,基于Martin Porter的Snowball项目,内置有许多语言的词干分析算法。GaussDB(DWS)中预定义有多种语言的Snowball词典,可通过系统表PG_TS_DICT查看预定义的词干分析词典以及支持的语言词干分析算法。
不同部分使用不同配置进行解析。因为setweight函数会对给定的tsvector中的语素进行统一设置,如果想要对文档的不同部分设置不同的权重,需要在连接之前对文本进行解析和权重设置。 setweight(vector tsvector, weight "char") returns
控制文本搜索 解析文档 解析查询 排序查询结果 高亮搜索结果 父主题: 全文检索
另外一种可能是:文档在文件系统中作为简单的文本文件存储。在这种情况下,数据库可以用于存储全文索引并且执行搜索,同时可以使用一些唯一标识从文件系统中检索文档。然而,从数据库外部检索文件需要拥有系统管理员权限或者特殊函数支持。因此,还是将所有数据保存在数据库中比较方便。同时,将所有数据保存在数据库中可以方便地访问文档元数据以便于索引和显示。
如果识别为停用词则返回空数组,即表示该标记会被丢弃。否则,输入标记的小写形式作为规范化后的lexeme返回。此外,Simple词典可通过设置参数Accept为false(默认值true),将非停用词报告为未识别,传递给后继词典继续处理。 注意事项 大多数词典的功能依赖于词典定义
punctuation not otherwise recognized) 注意:对于解析器来说,一个“字母”的概念是由数据库的语言区域设置,即lc_ctype设置决定的。只包含基本ASCII字母的词被报告为一个单独的token类型,因为这类词有时需要被区分出来。大多数欧洲语言中,对tok
附加功能 处理tsvector 处理查询 查询重写 收集文献统计 父主题: 全文检索
词典概述 词典用于定义停用词(stop words),即全文检索时不搜索哪些词。 词典还可以用于对同一词的不同形式进行规范化,这样同一个词的不同派生形式都可以进行匹配。规范化后的词称为词位(lexeme)。 除了提高检索质量外,词的规范化和删除停用词可以减少文档tsvector格式的大小,
限制约束 GaussDB(DWS)的全文检索功能当前限制约束是: 每个分词长度必须小于2K字节。 tsvector结构(分词+位置)的长度必须小于1兆字节。 tsvector的位置值必须大于0,小于等于16,383。 每个分词在文档中位置数必须小于256,若超过将舍弃后面的位置信息。
介绍 全文检索概述 文档概念 基本文本匹配 分词器 父主题: 全文检索
获取网卡状态 功能介绍 该接口用于获取主机监控网卡状态。 调用方法 请参见如何调用API。 URI GET /v1.0/{project_id}/dms/net 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。
控制文本搜索 解析文档 解析查询 排序查询结果 高亮搜索结果 父主题: 全文检索
如果识别为停用词则返回空数组,即表示该标记会被丢弃。否则,输入标记的小写形式作为规范化后的lexeme返回。此外,Simple词典可通过设置参数Accept为false(默认值true),将非停用词报告为未识别,传递给后继词典继续处理。 注意事项 大多数词典的功能依赖于词典定义
查询磁盘信息 功能介绍 该接口用于查询主机监控磁盘信息。 调用方法 请参见如何调用API。 URI GET /v1.0/{project_id}/dms/disk 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。
表和索引 搜索表 创建索引 索引使用约束 父主题: 全文检索
由于TZ词典需要识别短语,所以在处理过程中必须保存当前状态并与解析器进行交互,以决定是否处理下一个token或是结束当前识别。此外,TZ词典配置时需谨慎,如果设置TZ词典仅处理asciiword类型的token,则类似one 7的分类词典定义将不会生效,因为uint类型的token不会传给TZ词典处理。
查询主机概览 功能介绍 该接口用于查询主机监控概览信息。 调用方法 请参见如何调用API。 URI GET /v1.0/{project_id}/dms/host-overview 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。
搜索表 在不使用索引的情况下也可以进行全文检索。 一个简单查询:将body字段中包含science的每一行打印出来。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
负荷分析概述 GaussDB(DWS)的负荷分析工具为数据库提供性能数据收集和分析,用户可通过创建负荷信息快照记录指定时间段集群的负荷信息数据。其中两个负荷信息快照可形成该时间段内负荷诊断报告。负荷诊断报告(Workload Diagnosis Report,简称WDR)可以提供