检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Elasticsearch向量检索的性能测试和比较 应用场景 云搜索服务的向量检索引擎提供了全托管、高性能的分布式向量数据库服务。为了方便用户在业务场景进行向量搜索的性能压力测试,为产品选择和资源配置提供准确的参考依据,本文提供了基于开源数据集和开源压力测试工具的Elasticsearch向量检索的性能测试方案。
要获取的信息 获取方式 源集群 华为云Elasticsearch集群 源集群的名称 源集群的访问地址 访问源集群的用户名和密码(仅安全集群涉及) 获取集群名称和访问地址请参见3。 用户名和密码请联系服务管理员获取。 自建Elasticsearch集群 源集群的名称 源集群的公网访问地址
在迁移集群前,需要先获取必备的集群信息,用于配置迁移任务。 表1 需要获取的Elasticsearch集群信息 集群来源 要获取的信息 获取方式 源集群 华为云Elasticsearch集群 源集群的访问地址 访问源集群的用户名和密码(仅安全集群涉及) 获取集群名称和访问地址请参见3。 用户名和密码请联系服务管理员获取。
扩容实例的数量和存储容量 功能介绍 该接口用于集群扩容不同类型实例的个数以及存储容量。已经存在独立Master、Client、冷数据节点的集群使用该接口扩容。 调用方法 请参见如何调用API。 URI POST /v1.0/{project_id}/clusters/{cluster_id}/role_extend
使用esrally执行nyc_taxis数据集的测试,得到开启聚合增强时的结果。 测试结果 本次测试仅关注针对“dropoff_datetime”聚合的查询结果,即只关注“autohisto_agg”和“date_histogram_agg”两个任务的结果,以下为该任务的测试结果对比。 Metric Task
CSS服务中如何修改Elasticsearch和OpenSearch集群的TLS算法? 支持修改TLS算法的集群:7.6.2及以上版本的Elasticsearch集群、OpenSearch集群 登录云搜索服务控制台。 选择“集群管理”进入集群列表。 选择需要修改的集群,单击集群名称,进入集群基本信息页面。
指标”和“TopN指标”。 选择“云服务节点”页签,查看集群节点的监控指标。只会显示“资源实例”页签中选择的第一个资源实例的节点监控信息。 云服务节点:选择要查看监控信息的集群节点,默认选择当前集群的第一个节点。支持多选,进行数据对比。 支持设置监控时间,以及查看同一集群的同比/环比数据。
数据一致性高:利用读写分离的主从复制机制,确保数据在不同分片之间的同步,提高数据的一致性 。 迁移速度快:读写分离的自动同步速度依赖带宽,不受源集群和目标集群的影响,同步快。 实时性可控:读写分离的默认同步周期为30秒,支持修改,可以控制数据迁移的实时性,减少数据同步过程中的延迟 。 性能影响
实例”页签中选择的第一个资源实例的节点监控信息。 云服务节点:选择要查看监控信息的集群节点,默认选择当前集群的第一个节点。支持多选,进行数据对比。 支持设置监控时间,以及查看同一集群的同比/环比数据。 添加视图分组:支持在默认分组的基础上新增自定义的分组。当鼠标悬停在左侧分组名称
实例”页签中选择的第一个资源实例的节点监控信息。 云服务节点:选择要查看监控信息的集群节点,默认选择当前集群的第一个节点。支持多选,进行数据对比。 支持设置监控时间,以及查看同一集群的同比/环比数据。 添加视图分组:支持在默认分组的基础上新增自定义的分组。当鼠标悬停在左侧分组名称
方案一:关闭或者删除不用的索引,减少shard数量。 方案二:修改节点的shard数量的限制,参数配置请参考max_shards_per_node。 PUT _cluster/settings { "persistent": { "cluster": { "
并且要求节点个数大于等于AZ个数。 - 如果节点个数为AZ个数的倍数,节点将会均匀的分布到各个AZ。 - 如果节点个数不为AZ个数的倍数时,各个AZ分布的节点数量之差的绝对值小于等于1。 - 可用分区名称,请在地区和终端节点获取。 表5 CreateClusterInstanceVolumeBody
台为集群续费,以延长集群的使用时间。 操作步骤 登录云搜索服务管理控制台。 在集群管理页面,选择需要续费的包年/包月集群。 单击“操作”列下的“更多 > 续费”。 在“续费”页面,选择集群的续费时长,判断是否勾选“统一到期日”,将集群到期时间统一到各个月的某一天(详细介绍请参见统一包年/包月资源的到期日)。
配置和使用OpenSearch集群的自定义词库 前提条件 已经准备好集群和自定义词库,且词库文件已上传至OBS桶。 集群和词库文件满足约束限制。 上传的OBS桶必须和集群在相同“区域”。上传文件至OBS桶的操作步骤请参见上传文件。 配置自定义词库 登录云搜索服务管理控制台。 在左
0/{project_id}/clusters/{cluster_id}/logs/settings 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法请参见获取项目ID和名称。 cluster_id 是 String 指定更改日志基础配置的集群ID。 表2
副本构建的开销。 调整“refresh_interval”为120s或者更大,避免频繁刷新索引生成大量小的segments,同时减少merge带来的向量索引构建开销。 适当调大“native.vector.index_threads”的值(默认为4),增加向量索引构建的线程数。 PUT
副本构建的开销。 调整“refresh_interval”为120s或者更大,避免频繁刷新索引生成大量小的segments,同时减少merge带来的向量索引构建开销。 适当调大“native.vector.index_threads”的值(默认为4),增加向量索引构建的线程数。 PUT
0/{project_id}/clusters/{cluster_id}/logs/open 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法请参见获取项目ID和名称。 cluster_id 是 String 指定开启日志的集群ID。 表2 Query参数
0/{project_id}/clusters/{cluster_id}/lgsconf/submit 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法请参见获取项目ID和名称。 cluster_id 是 String 指定创建配置文件的集群ID。 请求参数
String 参数解释: 项目ID。获取方法请参见获取项目ID和名称。 约束限制: 不涉及 取值范围: 获取方法请参见获取项目ID和名称。 默认取值: 不涉及 cluster_id 是 String 参数解释: 指定需查询自动创建快照策略的集群ID。 约束限制: 不涉及 取值范围: 获取方法请参见获取集群ID。