检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
测试和调试文本搜索 分词器测试 解析器测试 词典测试 父主题: 全文检索
测试方法 总体流程 创建弹性云服务器ECS和数据仓库GaussDB(DWS) 构建TPC-H&TPC-DS使用数据 建表与数据导入 执行查询与结果收集
段内负荷诊断报告。负荷诊断报告(Workload Diagnosis Report,简称WDR)可以提供指定时间段内的性能数据,以HTML网页报告的形式呈现给用户,能够帮助用户发现异常、诊断问题、优化性能等,其内容丰富直观,是数据库调优的利器。 负荷分析功能仅8.1.1.300及以上集群版本支持。
步骤3:调优表操作具体步骤 选择存储方式 此实践中所使用的样例表为典型的TPC-DS表,是典型的多字段表,统计分析类查询场景多,因此选择列存存储方式。 1 WITH (ORIENTATION = column) 选择压缩级别 在步骤1:创建初始表并加装样例数据中没有指定压缩比,
词典测试 函数ts_lexize用于进行词典测试。 ts_lexize(dict regdictionary, token text) returns text[]如果输入的token可以被词典识别,那么ts_lexize返回词素的数组;如果token可以被词典识别但它是一个停用
测试结果 TPC-H 单并发查询 TPC-DS 单并发查询
SSB测试数据 表1 SSB测试数据 序号 表名 行数 表大小 1 supplier 200000 - 2 customer 3000000 - 3 part 1400000 - 4 lineorder 60037902 - 5 lineorder_flat 60037902 -
TPC-H查询测试 TPC-H由国际事务处理性能委员会(Transaction Processing Performance Council)制定发布,用于评测数据库的分析查询能力。TPC-H查询包含8张数据表和22条复杂SQL查询,大多数查询包含多表Join、子查询和Group
SSB查询测试 SSB(Star Schema Benchmark)是一种在学术界和工业界广泛应用的数据库系统性能评估基准测试方法。它能够对比不同数据仓库在处理星型模型查询时的性能,帮助数据库管理员和决策者选择最符合需求的数据库系统。此外,参考OLAP行业的做法,将SSB中的星型
SSB测试结果 经过针对SSB宽表场景对DWS和开源OLAP产品ClickHouse的对比测试发现:使用hstore_opt表,配合turbo存储、turbo引擎, DWS查询性能整体优于开源产品ClickHouse 2倍。 表1 SSB测试结果 SSB DWS ClickHouse
解析器测试 函数ts_parse可以直接测试文本搜索解析器。 1 2 ts_parse(parser_name text, document text, OUT tokid integer, OUT token text) returns setof record
1.0版本和8.3.0版本进行性能对比测试。基于SSB-Flat测试集,对DWS 9.1.0版本和开源OLAP产品ClickHouse进行对比测试。本次性能测试时间为2024年11月。 TPC-H TPC-H由国际事务处理性能委员会(Transaction Processing Performance
9.1.0版本测试结论 性能总览
分词器测试 函数ts_debug允许简单测试文本搜索分词器。 1 2 3 4 5 6 7 8 ts_debug([ config regconfig, ] document text, OUT alias text, OUT description
TPC-DS查询测试 您可以通过命令生成方法生成TPC-DS测试集,也可以直接通过脚本生成方法生成,另我们已经给出前面20个的TPC-DS测试集供您参考。 命令生成方法 TPC-DS标准99个SQL查询语句可用如下方法生成: 准备工作。生成TPC-DS查询语句前需要修改query_templates目录下的文件:
词典测试 函数ts_lexize用于进行词典测试。 ts_lexize(dict regdictionary, token text) returns text[]如果输入的token可以被词典识别,那么ts_lexize返回词素的数组;如果token可以被词典识别但它是一个停用
(SS.DELETE_FLAG = 'N' or SS.DELETE_FLAG is null) 建议3.11 资源高消耗型SQL需做好压力测试和并发管控 违反规范的影响: 存储和计算资源过载,整体运行性能下降。 方案建议: 高资源消耗型SQL的主要特征: 大量UNION ALL
(SS.DELETE_FLAG = 'N' or SS.DELETE_FLAG is null) 建议3.11 资源高消耗型SQL需做好压力测试和并发管控 违反规范的影响: 存储和计算资源过载,整体运行性能下降。 方案建议: 高资源消耗型SQL的主要特征: 大量UNION ALL
9.1.0版本存算一体架构TPC-H总查询耗时为170.08秒,相较8.3.0版本的533.05秒,性能提升208%。 9.1.0版本存算分离架构与存算一体架构性能劣化在10%以内。 TPC-H 1000x测试基准22个SQL中,9.1.0.200版本相比8.3.0版本,所有SQL查询性能提升达到1
PGXC_GET_STAT_ALL_TABLES PGXC_GET_STAT_ALL_TABLES视图获取各表的插入、更新、删除以及脏页率信息。 对于高脏页率的系统表,建议在确认当前没有用户操作该系统表时,再执行VACUUM FULL。建议对脏页率超过80%的非系统表执行VACUUM