使用Elasticsearch AI搜索实现语义检索 CSS服务结合搜索大模型的知识搜索能力,在传统字符搜索的基础上集成语义搜索能力,通过向量化技术提升搜索结果相关性。本方案兼容开源Elasticsearch生态,业务仅需适配multi_match查询语句即可实现语义检索。 应用场景
Elasticsearch AI搜索介绍 传统搜索引擎依赖关键词匹配,难以捕捉语义关联,且无法处理多模态数据。为突破这一局限,Elasticsearch AI搜索通过集成CSS向量数据库与搜索大模型,构建了具备语义理解、多模态处理和知识问答能力的智能搜索体系。其核心价值在于: 语
使用搜索大模型实现Elasticsearch AI搜索 Elasticsearch AI搜索介绍 开启搜索大模型插件 配置模型服务 将模型服务关联到向量索引 语义查询 使用Elasticsearch AI搜索实现语义检索 父主题: 使用Elasticsearch搜索数据
"excludes": "image_vector" // 排除返回结果中的image_vector字段 }, "query": { "vector": { // 启用向量搜索功能 "image_vector": { // 指定目标向量字段名称(需与索引映射一致)
Elasticsearch集群在部署Embedding节点后,会预装搜索大模型插件(默认关闭状态)。该插件为集群提供了AI模型服务集成能力,通过开启插件并配置各类模型服务,您可以将先进的AI能力无缝集成到搜索业务中。 前提条件 确认Elasticsearch集群满足以下条件: 集群状态:可用 集群版本:7
将模型服务关联到向量索引 通过将已配置的模型服务关联到向量索引,可以为索引赋予AI处理能力。该配置通过索引级别的设置实现以下核心功能: 向量化处理:在数据写入时自动调用Embedding模型服务将文本转换为向量。 智能搜索:在查询时结合向量相似度和传统文本相关性进行混合检索。 结
"total_search_in_millis" : 164 }, "status" : { "search_failed" : false, "rewrite" : true, "retrieval" : true, "reranking"
度量方式,可选值为:euclidean、inner_product、cosine、hamming。 默认值:euclidean。 Painless语法扩展查询 CSS扩展实现了多种向量距离计算函数,可在自定义的painless脚本中直接使用,用以构建灵活的重打分公式。 示例如下: POST my_index/_search
配置模型服务 搜索大模型插件通过模型服务将AI能力集成到Elasticsearch集群中,实现语义向量搜索、语义排序等高级功能。其核心流程是基于业务需求(如语义搜索、智能推荐)定义模型类型(Embedding/Rerank等),并绑定对应的AI服务地址,确保上层应用能通过向量索引正确调用服务接口。
度量方式,可选值为:euclidean、inner_product、cosine、hamming。 默认值:euclidean。 Painless语法扩展查询 CSS扩展实现了多种向量距离计算函数,可在自定义的painless脚本中直接使用,用以构建灵活的重打分公式。 示例如下: POST my_index/_search
DeleteAiOpsRequest request = new DeleteAiOpsRequest(); request.withClusterId("{cluster_id}"); request.withAiopsId("{aiops_id}");
云搜索服务可以帮助网站和APP搭建搜索框,提升用户的搜索体验;也可以用于搭建日志分析平台,助力企业实现数据驱动运维,数据驱动运营;它的向量检索能力可以帮助客户快速构建基于AI的图搜、推荐、语义搜索等丰富的应用。 站内搜索 云搜索服务可用于对网站内容进行关键字检索、对电商网站商品进行检索与推荐。 实时检索:站内资
Boolean 参数解释: 是否需要上传升级后版本的插件。 imageInfoList Array of GetTargetImageIdDetail objects 参数解释: 镜像详情信息。 表3 GetTargetImageIdDetail 参数 参数类型 描述 id String 参数解释:
产品优势 云搜索服务主要有以下特点与显著优势: 高效易用 TB级数据毫秒级返回检索结果,提供可视化平台方便数据展示和分析。 弹性灵活 按需申请,在线扩容,零业务中断,快速应对业务增长。 无忧运维 全托管服务,开箱即用,主要操作一键可达,专业团队贴身看护。 内核增强 向量检索 云搜
0/{project_id}/domains/{domain_id}/ai-ops/smn-topics 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法请参见获取项目ID和名称。 domain_id 是 String 域账号ID。
索引分片无法分配。 处理步骤 在Kibana的“Dev Tools”页面,执行命令GET _cluster/allocation/explain?pretty查看索引分片未分配的原因。 返回结果中显示索引名称“index” 和未分配解释“explanation” : “primary
单击集群名称进入集群基本信息页面,选择“日志管理”,单击“日志查询”页签,可见日志内容存在明显的关于插件的报错“fatal error in thread [main], exitingjava.lang. NoClassDefFoundError: xxx/xxx/.../xxxPlugin at
-efa8-4598-bf91-560aad1377a3/inst-type/all/image/upgrade { "target_image_id" : "{target_image_id}", "upgrade_type" : "same", "indices_backup_check"
Elasticsearch集群某一节点分配不到shard 解决方案 使用GET _cluster/allocation/explain?pretty 查看未分配shard。 在console上,选择“cerebro > more > cluster settings ”-,在左上角输入“allocation
SUCCESS:任务成功。 FAILED:任务失败。 PARTIAL_FAILED:部分任务失败。 agencyName String 参数解释: 委托名称,委托给CSS,允许CSS调用您的其他云服务。 imageInfo GetTargetImageIdDetail object 参数解释:
您即将访问非华为云网站,请注意账号财产安全