云数据库 RDS-使用zhparser插件:基本使用

时间:2024-12-20 17:08:36

基本使用

  • 全文检索中文分词功能
    -- 查看Zhparser的词典配置
    SELECT ts_token_type('zhparser');
    -- 配置中文解析器
    CREATE TEXT SEARCH CONFIGURATION testzhcfg (PARSER = zhparser);
  • 添加分词策略
    -- 添加名词(n)、动词(v)、形容词(a)、成语(i)、叹词(e)和习用语(l) 六种分词策略
    ALTER TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH simple;
  • 测试分词效果(to_tsvector)
    SELECT to_tsvector('testzhcfg','华为云数据库 RDS for PostgreSQL是一种典型的开源关系型数据库,在保证数据可靠性和完整性方面表现出色,支持互联网电商、地理位置应用系统、金融保险系统、复杂数据对象处理等场景。');
    to_tsvector
    ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
    -------------------------------------------------------------------------------------------------------------------------
    'for':5 'postgresql':6 'rds':4 '云':2 '互联网':19 '保证':11 '典型':8 '出色':17 '华为':1 '可靠性':13 '地理位置':21 '场景':30 '处理':28 '复杂':25 '完整性':14 '对象':27 '应用系统':22 '开源':9 '支持':18 '数据':12,26 '数据库':3,10 '方面':15 '是':7 '电商':20 '等':29 '系统':24 '表现':16 '金融保险':23
    (1 row)
  • 测试分词效果(to_tsquery)
    SELECT to_tsquery('testzhcfg', 'PostgreSQL是一种典型的开源关系型数据库,在保证数据可靠性和完整性方面表现出色');
    to_tsquery
    ---------------------------------------------------------------------------------------------------------------------------------------------
    'postgresql' & '是' & '典型' & '开源' & '数据库' & '保证' & '数据' & '可靠性' & '完整性' & '方面' & '表现' & '出色'
    (1 row)
support.huaweicloud.com/usermanual-rds/rds_09_0065.html