检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
下载“sift-128-euclidean”和“gist-960-euclidean”数据 准备测试工具。 准备数据写入和召回率测试脚本,参考脚本base_test_example.py。 下载性能测试使用的开源压测工具Wrk,获取地址https://github.com/wg/wrk/tree/master。
SQL数据库,以及使用SSL安全连接,可以保证数据传输的安全性和系统的稳定性。 易于监控和维护:Elasticsearch提供了丰富的监控工具和API,使得系统维护和性能监控变得更加容易。 扩展性:Elasticsearch集群可以根据业务需求进行水平扩展,增加更多的节点来处理更大的数据量和查询负载。
创建向量索引的操作流程如下所示: (可选)准备工作:根据业务需要,完成集群高级配置。 (可选)预构建与注册中心点向量:当选择使用“IVF_GRAPH”或“IVF_GRAPH_PQ”索引算法创建向量索引时,则需要对中心点向量进行预构建和注册。 创建向量索引:基于业务场景创建向量索引。 导入向量数据:将向量数据导入集群。
IP地址和端口号,例如“10.62.179.32:9200,10.62.179.33:9200”。 默认方式 内网 终端节点IP地址或内网域名 通过配置终端节点实现内网场景下跨VPC访问集群。适用于对性能要求不高的场景。 获取方式: 在云搜索服务管理控制台,单击左侧导航栏的“集群管理”。
图1 查询所有仓库信息 bucket:OBS桶名。 base_path:路径名称。前缀默认固定,后面是集群名称。 endpoint:OBS域名。 region:所在region。 查询指定快照信息。 执行GET _snapshot/repo_auto/_all命令,查询当前仓库下面所有的快照列表。
支付,详细的计费方式请参考终端节点计费说明。 表6 配置终端节点服务 参数 说明 创建内网域名 勾选“创建内网域名”,系统除了生成一个“节点IP”还会自动创建一个“内网域名”,通过这个域名可以在同一个VPC内访问该集群。不勾选的话只会生成一个“节点IP”。 创建专业型终端节点 选择是否创建专业型终端节点。
前端端口 客户端与负载均衡监听器建立流量分发连接的端口。 根据实际业务需要自定义。 SSL解析方式 客户端到服务器端认证方式。仅“前端协议”选择“HTTPS”才需要配置。 根据实际业务需要选择解析方式。 服务器证书 服务器证书用于SSL握手协商,需提供证书内容和私钥。仅“前端协议”选择“HTTPS”才需要配置服务器证书。
"65382450e8f64ac0870cd180d14exxxx", "name": "xxx", //项目名称,即部署区域名称 "description": "", "links": {
前端端口 客户端与负载均衡监听器建立流量分发连接的端口。 根据实际业务需要自定义。 SSL解析方式 客户端到服务器端认证方式。仅“前端协议”选择“HTTPS”才需要配置。 根据实际业务需要选择解析方式。 服务器证书 服务器证书用于SSL握手协商,需提供证书内容和私钥。仅“前端协议”选择“HTTPS”才需要配置服务器证书。
支付,详细的计费方式请参考终端节点计费说明。 表6 配置终端节点服务 参数 说明 创建内网域名 勾选“创建内网域名”,系统除了生成一个“节点IP”还会自动创建一个“内网域名”,通过这个域名可以在同一个VPC内访问该集群。不勾选的话只会生成一个“节点IP”。 创建专业型终端节点 选择是否创建专业型终端节点。
阶段 相关文档 1 更改集群名称 云搜索服务支持集群创建成功后,可以修改集群名称。 商用 创建集群 2 终端节点服务 云搜索服务支持通过内网域名的方式访问集群。 商用 终端节点服务 2020年1月 序号 功能名称 功能描述 阶段 相关文档 1 插件管理 云搜索服务支持查看系统默认插
通过指定配置项“index.aggr_perf_batch_size”可以开启集群的Bulk聚合优化。Bulk聚合优化是通过批量导入将Bulk请求中的doc从单个依次写入变为批量写入,该方案可以有效减少内存申请、锁申请、及其他调用开销,从而提升数据导入性能。 Bulk聚合优化 文本索引加速 通过指定配置项“index
通过指定配置项“index.aggr_perf_batch_size”可以开启集群的Bulk聚合优化。Bulk聚合优化是通过批量导入将Bulk请求中的doc从单个依次写入变为批量写入,该方案可以有效减少内存申请、锁申请、及其他调用开销,从而提升数据导入性能。 Bulk聚合优化 文本索引加速 通过指定配置项“index
"number_of_shards": 1 } } boolean类型解析变化 在Elasticsearch 5.x版本中,true、false、on、off、yes、no、0和1的值都可以被解析成boolean。 Elasticsearch 6.x及以上版本只接受true/false,其他值会发生异常错误。
重启集群 扩容集群 扩容实例的数量和存储容量 变更规格 获取实例规格列表 查询所有标签 查询指定集群的标签 添加指定集群标签 删除集群标签 批量添加或删除集群标签 指定节点缩容 指定节点类型规格变更 指定节点类型缩容 下载安全证书 节点替换 安全模式修改 添加独立master、client
使用SSD盘可以大幅提升数据写入与merge操作的速度,对应到CSS服务,建议选择“超高IO型”存储,或者超高IO型主机。 采用Bulk API 客户端采用批量数据的写入方式,每次批量写入的数据建议在1~10MB之间。 随机生成_id 如果采用指定_id的写入方式,数据写入时会先触发一次查询操作,进而影响数据
# 存储仓库类型。 "type": "oss", "settings": { # 步骤1中存储仓库的内网访问域名。 "endpoint": "http://oss-xxx.example.com", # 存储仓库的用户ID和密码。认证用的a
能力,包括分布式、多副本、错误恢复、快照、权限控制等;兼容所有原生Elasticsearch生态,包括集群监测工具Cerebro,可视化工具Kibana,实时数据采集工具Logstash等;提供Python/Java/Go/C++等多种客户端语言支持。 视频介绍 约束限制 仅Elasticsearch
能力,包括分布式、多副本、错误恢复、快照、权限控制等;兼容所有原生Elasticsearch生态,包括集群监测工具Cerebro,可视化工具Kibana,实时数据采集工具Logstash等;提供Python/Java/Go/C++等多种客户端语言支持。 视频介绍 约束限制 仅Elasticsearch
"persistent": { "native.vector.index_threads": 8 } } 查询性能优化 在批量导入场景下,数据写入完成后,执行forcemerge操作能有效提升查询效率。 POST index_name/_forcemerge?max_num_segments=1