检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置Elasticsearch集群向量检索 向量检索特性介绍 在Elasticsearch集群创建向量索引 在Elasticsearch集群使用向量索引搜索数据 在嵌套字段中使用向量索引 优化向量检索写入与查询性能 管理向量索引缓存 向量检索的客户端代码示例(Python) 向量检索的客户端代码示例(Java)
词库文件必须是UTF-8无BOM格式编码的文本文件,一行一个分词,主词文件最大支持100M。如果涉及单词,必须改成小写字母。 停词词库 停词为用户不希望进行分词或者关注的词语,例如“的”、“什么”、“怎么”等。停词词库是用户自定义的停词词语的集合。 词库文件必须是UTF-8无BOM格式编码的文本文件
配置OpenSearch集群自定义词库 OpenSearch集群词库介绍 配置和使用OpenSearch集群的自定义词库 父主题: 管理OpenSearch集群
name 是 String 配置文件名称。 请求参数 无 响应参数 状态码:200 表3 响应Body参数 参数 参数类型 描述 name String 配置文件名称。 status String 配置文件状态。 confContent String 配置文件内容。 setting
参数类型 描述 project_id 是 String 项目ID。获取方法请参见获取项目ID和名称。 cluster_id 是 String 指定配置自定义词库的集群ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 bucketName 是 String 词库文件
创建向量索引的操作流程如下所示: (可选)准备工作:根据业务需要,完成集群高级配置。 (可选)预构建与注册中心点向量:当选择使用“IVF_GRAPH”或“IVF_GRAPH_PQ”索引算法创建向量索引时,则需要对中心点向量进行预构建和注册。 创建向量索引:基于业务场景创建向量索引。 导入向量数据:将向量数据导入集群。
功的集群进行日常监控。配置集群监控后,就可以在CES管理控制台直观查看集群的监控指标数据。 配置集群监控的操作流程: 配置告警规则:根据实际业务需要对监控指标设置自定义告警规则,当监控指标超过设置的阈值时,会以邮箱、HTTP、HTTPS等方式通知您。 配置监控对象:为集群或集群中某个节点配置监控指标。
配置Elasticsearch集群聚合增强 场景描述 聚合增强在数据聚簇的情况下,利用向量化技术,批量处理数据,从而提升聚合性能,优化可观测性业务的聚合分析能力。 在大规模数据的集聚合分析场景下,耗时主要集中在对数据的分组聚合。 提升分组聚合能力依赖排序键和聚簇键。 排序键:数据按照排序键顺序存储。
热停止某个迁移任务 当需要停止管道列表中某一个配置文件的数据迁移任务时,勾选管道,单击管道列表上方的“热停止”。 根据对话框提示,单击“确定”,停止所选管道的数据迁移任务。 热停止成功则可以看到管道列表中目标配置已被移除且该管道数据迁移中断。 父主题: 配置Logstash迁移任务
修改集群快照的基础配置 功能介绍 该接口用于修改集群快照的基础配置,可修改OBS桶和IAM委托。 可以使用该接口开启快照功能。 调用方法 请参见如何调用API。 URI POST /v1.0/{project_id}/clusters/{cluster_id}/index_snapshot/setting
参考 TCP长连接和短连接 TCP协议中有长连接和短连接之分。短连接在数据包发送完成后会自己断开,长连接在发包完成后, 会在一定的时间内保持连接,即通常所说的Keepalive(存活定时器)功能。 TCP保活机制 保活机制是由一个保活计时器实现的。当计时器被激发,连接一端将发送一个保活探测报文,
中文简体关键字搜索出包含对应中文繁体的索引数据。 云搜索服务默认安装了简繁体转换插件,用户无需自行安装。 简繁体转换插件通常可以当做analyzer、tokenizer、token-filter或char-filter来使用。 简繁体转换插件的转换类型包含如下两种: s2t:将中文简体转换为中文繁体。
DocValues) 汉明距离函数。只支持"dim_type"为"binary"的向量字段,输入的查询向量需要为Base64编码字符串格式。 父主题: 配置OpenSearch集群向量检索
项目ID。获取方法请参见获取项目ID和名称。 cluster_id 是 String 指定删除配置文件的集群ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 配置文件名称。 响应参数 无 请求示例 删除配置文件 POST https://{Endpoint}//v2
需要4字节。 num 向量总条数。 delta 元数据大小,该项通常可以忽略。 frag_num 量化编码时的向量分段数,创建索引时如果未配置该值,则由向量维度“dim”决定。 if dim <= 256: frag_num = dim / 4 elif dim <= 512:
词库文件必须是UTF-8无BOM格式编码的文本文件,一行一个分词,主词文件最大支持100M。如果涉及单词,必须改成小写字母。 停词词库 停词为用户不希望进行分词或者关注的词语,例如“的”、“什么”、“怎么”等。停词词库是用户自定义的停词词语的集合。 词库文件必须是UTF-8无BOM格式编码的文本文件
配置Elasticsearch集群自定义词库 Elasticsearch集群词库介绍 配置和使用Elasticsearch集群的自定义词库 父主题: 管理Elasticsearch集群
需要4字节。 num 向量总条数。 delta 元数据大小,该项通常可以忽略。 frag_num 量化编码时的向量分段数,创建索引时如果未配置该值,则由向量维度“dim”决定。 if dim <= 256: frag_num = dim / 4 elif dim <= 512:
objects 配置文件列表。 表3 confs 参数 参数类型 描述 name String 配置文件名称。 status String 配置文件状态。 confContent String 配置文件内容。 setting setting object 具体的配置内容对象。 updateAt
创建向量索引的操作流程如下所示: (可选)准备工作:根据业务需要,完成集群高级配置。 (可选)预构建与注册中心点向量:当选择使用“IVF_GRAPH”或“IVF_GRAPH_PQ”索引算法创建向量索引时,则需要对中心点向量进行预构建和注册。 创建向量索引:基于业务场景创建向量索引。 导入向量数据:将向量数据导入集群。