云搜索服务 CSS-向量检索特性介绍:原理说明
原理说明
向量检索从本质上讲,其思维框架和传统的检索方法没有区别。为了提升向量检索的性能,通常需要解决以下两个问题:
- 减少候选向量集
和传统的文本检索类似,向量检索也需要某种索引结构来避免在全量的数据上做匹配,传统文本检索是通过倒排索引来过滤掉无关文档,而向量检索是通过对向量建立索引结构来绕过不相关的向量,减小需要考察的范围。
- 降低单个向量计算的复杂度
向量检索支持漏斗模型,先对所有向量进行量化和近似计算,筛选出一定量接近检索目标的数据集,然后基于筛选的数据集进行精细的计算和排序。本方法不需要对所有向量都进行复杂的计算,可以有效提高检索效率。
向量检索即在一个给定的向量数据集中,按照某种度量方式,检索出与查询向量相近的K个向量(K-Nearest Neighbor,KNN),但由于KNN计算量过大,通常只关注近似近邻(Approximate Nearest Neighbor,ANN)问题。
- CSS是什么_云搜索服务_CSS功能
- MapReduce服务_什么是ClickHouse_如何使用ClickHouse
- GaussDB原理_GaussDB数据库原理_高斯数据库原理-华为云
- 云手机是什么_云手机功能介绍_云手机原理_手机云服务
- GaussDB(for MySQL)重点特性介绍_升级Proxy内核版本_重启Proxy实例
- 大数据应用范围有哪些_大数据技术与应用要学习什么课程
- 什么是自然语言处理_自然语言处理应用场景有哪些
- MPA遵从性说明通用指南
- ModelArts计费说明_计费简介_ModelArts怎么计费
- GaussDB产品特性_gaussdb最大优势_高斯数据库产品特性_华为云