检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为了提升向量检索的性能,通常需要解决以下两个问题: 减少候选向量集 和传统的文本检索类似,向量检索也需要某种索引结构来避免在全量的数据上做匹配,传统文本检索是通过倒排索引来过滤掉无关文档,而向量检索是通过对向量建立索引结构来绕过不相关的向量,减小需要考察的范围。 降低单个向量计算的复杂度
为了提升向量检索的性能,通常需要解决以下两个问题: 减少候选向量集 和传统的文本检索类似,向量检索也需要某种索引结构来避免在全量的数据上做匹配,传统文本检索是通过倒排索引来过滤掉无关文档,而向量检索是通过对向量建立索引结构来绕过不相关的向量,减小需要考察的范围。 降低单个向量计算的复杂度
复合查询 向量检索支持与其他OpenSearch子查询组合进行复合查询,比如布尔查询方式。 布尔查询实际上是后置过滤查询方式。过滤条件与向量相似度检索分别独立执行,执行完成后对两者的检索结果进行合并,合并逻辑由must、should、filter等谓词决定。 例如,查询Top10条“
以下示例的查询场景:查询Top10条“my_label”的值为“red”的结果。 前置过滤查询:先执行过滤条件检索,筛选出符合条件的结果;然后,对这些筛选后的候选结果进行向量相似度检索,以找出最相似的向量。 查询示例如下: POST my_index/_search { "size": 10, "query":
安全集群,默认有一个“. opendistro_security”索引,不可执行写操作,修改索引读写模式时要忽略掉这个索引。 解决方案 使用通配符进行匹配,将indexname用通配符代替。 PUT indexname/_settings { "index": { "blocks": { "
LZ4算法是Elasticsearch的默认压缩算法,该算法对数据的解压/压缩效率很快,但压缩率较低一些。 压缩算法的实现流程:压缩过程以至少4个bytes为扫描窗口查找匹配,每次移动1byte进行扫描,遇到重复的就进行压缩。该算法适用于读取量大、写入量小的场景。 best_compression算法 除了默认
征向量数据进行最近邻或近似近邻检索。 高效可靠:华为云向量检索引擎,提供优秀的搜索性能以及分布式容灾能力。 索引丰富:支持多种索引算法及相似度度量方式,满足各类应用场景及需求。 “0”学习成本:完全兼容开源ES语法与生态。 图4 向量检索场景
判断主从集群的索引同步方式。查询从集群是否有索引同步的匹配模式,命令参考查询并删除集群匹配模式。 如果没有匹配模式,则表示主从集群是指定索引同步关系,则执行3。 如果有匹配模式,则表示主从集群是模式匹配索引同步关系,则执行2。 删除从集群的索引同步的匹配模式,命令参考查询并删除集群匹配模式。 从集群停止索引同
用绝对好评率计算总分,按照总分由高到低的顺序排列出查询结果。 总分 = 匹配得分 * (好评率 * 绝对因子) 匹配得分:根据查询结果计分,内容匹配记1分,否则记0分,得分之和即为匹配得分。 好评率:从匹配项的数据内容中获取好评率的值,一般指单条数据的评分。 绝对因子:自定义的好评比例。
r等同于SQL的where会过滤字段但不参与ES搜索的打分机制,must也属于过滤必须满足的条件,但是会根据查询的匹配程度对搜索到的文档进行打分,在返回的结果中越匹配的文档会越靠前显示。 GET /_search { "query": { "bool": {
~1024个字符,不能包含空格和大写字母,且不能包含“"\<|>/?”特殊字符。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 在恢复时,可以根据文本框中定义的过滤条件去恢复符合条件的索引,过滤条件请使用正则表达式。默认值“index_(
r等同于SQL的where会过滤字段但不参与ES搜索的打分机制,must也属于过滤必须满足的条件,但是会根据查询的匹配程度对搜索到的文档进行打分,在返回的结果中越匹配的文档会越靠前显示。 GET /_search { "query": { "bool": {
~1024个字符,不能包含空格和大写字母,且不能包含“"\<|>/?”特殊字符。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 在恢复时,可以根据文本框中定义的过滤条件去恢复符合条件的索引,过滤条件请使用正则表达式。默认值“index_(
恢复所有的索引数据。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 索引名称匹配规则。“索引名称匹配模式”和“索引名称替换模式”必须同时设置才会生效。通过配置这两参数,可对快照中匹配到的索引进行重命名。 索引名称替换模式
~1024个字符,不能包含空格和大写字母,且不能包含“"\<|>/?”特殊字符。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 在恢复时,可以根据文本框中定义的过滤条件去恢复符合条件的索引,过滤条件请使用正则表达式。默认值“index_(
当返回结果中,“acknowledged”为“true”时,表示配置成功。 在目标集群配置索引自动同步,实现源集群的数据自动同步到目标集群。 执行如下命令,创建匹配模式同步索引,将源集群中匹配的索引同步到目标集群中。 PUT auto_sync/pattern/pattern1 { "remote_cluster":
[_tier_preference:"data_hot OR data_warm OR data_cold"]” 集群的某个索引设置的参数与版本不匹配。 参考•索引参数版本不匹配 “explanation”中存在“cannot allocate because all found copies of the
的配额,配额内使用量不再收费,超出配额的使用量以按需计费方式收费。 所购买的集群的区域、节点规格、存储类型或者带宽类型,必须和套餐包购买的匹配,否则无法使用套餐包。 父主题: 计费相关
// 向量维度 " \"metric\": \"euclidean\",\n" + // 相似度度量 " \"algorithm\": \"GRAPH\"\n" + // 索引算法
// 向量索引 " \"metric\": \"euclidean\"," + // 相似度度量 " \"algorithm\": \"GRAPH\"" + // 索引算法