检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文档概念 文档是全文搜索系统的搜索单元,例如:杂志上的一篇文章或电子邮件消息。文本搜索引擎必须能够解析文档,而且可以存储父文档的关联词素(关键词)。后续,这些关联词素用来搜索包含查询词的文档。
文档约定 本节描述了本手册的内容、符号、和命令约定。 内容约定 所购买的产品、服务和特性以所签订的合同为准。本文档中描述的所有或部分的产品、服务和特性可不属于购买范围或使用范围。
解析文档 GaussDB(DWS)中提供了to_tsvector函数把文档处理成tsvector数据类型。
文档概念 文档是全文搜索系统的搜索单元,例如:杂志上的一篇文章或电子邮件消息。文本搜索引擎必须能够解析文档,而且可以存储父文档的关联词素(关键词)。后续,这些关联词素用来搜索包含查询词的文档。
收集文档统计信息 函数ts_stat可用于检查配置和查找候选停用词。
解析文档 GaussDB(DWS)中提供了to_tsvector函数把文档处理成tsvector数据类型。
---------- t (1 row) xml IS NOT DOCUMENT 描述:如果参数XML值不是一个正确的XML文档,则IS NOT DOCUMENT返回真;如果是正确XML文档,则返回假;参数为空时返回空。
控制文本搜索 解析文档 解析查询 排序查询结果 高亮搜索结果 父主题: 全文检索
---------- t (1 row) xml IS NOT DOCUMENT 描述:如果参数XML值不是一个正确的XML文档,则IS NOT DOCUMENT返回真;如果是正确XML文档,则返回假;参数为空时返回空。
介绍 全文检索概述 文档概念 基本文本匹配 分词器 限制约束 父主题: 全文检索
由于没有索引的支持,每一次的搜索需要遍历所有的文档,整体搜索比较缓慢。 使用全文索引可以对文档进行预处理,并且可以使后续的搜索更快速。预处理过程包括: 将文档解析成token。
本文档详细介绍了DWS API、参数、示例以及调用方法。
高亮搜索结果 搜索结果的理想显示是列出每篇文档中与搜索相关的部分,并标识为什么与查询相关。搜索引擎能够显示标识了搜索词的文档片段。GaussDB(DWS)提供了函数ts_headline支持这部分功能。
当搜索出成千的文档时,查找效率很低。 由于没有索引的支持,每一次的搜索需要遍历所有的文档,整体搜索比较缓慢。 使用全文索引可以对文档进行预处理,并且可以使后续的搜索更快速。预处理过程包括: 将文档解析成token。
如果在文档中没有找到所有的查询词,则文档中开头将显示MinWords单片段。 FragmentDelimiter:当有一个以上的片段时,通过该字符串分隔这些片段。
(nulls boolean, tableforest boolean, targetns text) 描述:把数据库的表映射成XML值和模式文档。
(nulls boolean, tableforest boolean, targetns text) 描述:把数据库的表映射成XML值和模式文档。
介绍 全文检索概述 文档概念 基本文本匹配 分词器 父主题: 全文检索
由于较长的文档有更多的机会包含查询词,因此有必要考虑文档的大小。例如,包含有5个搜索词的一百字文档比包含有5个搜索词的一千字文档相关性更高。两个预置的排序函数都采用了一个整型的标准化选项来定义文档长度是否影响排序及如何影响。
排序查询结果 排序试图针对特定查询衡量文档的相关度,从而将众多的匹配文档中相关度最高的文档排在最前。GaussDB(DWS)提供了两个预置的排序函数。函数考虑了词法,距离,和结构信息;也就是,考虑查询词在文档中出现的频率、紧密程度、以及出现的地方在文档中的重要性。