检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题: 减少候选向量集 和传统的文本检索类似,向量检索也需要某种索引结构来避免在全量的数据上做匹配,传统文本检索是通过倒排索引来过滤掉无关文档,而向量检索是通过对向量建立索引结构来绕过不相关的向量,减小需要考察的范围。 降低单个向量计算的复杂度 向量检索支持漏斗模型,先对所有向量
入性能以及降低写入拒绝的情况。适用于索引分片较多、文本索引量大、导入吞吐量高的场景。 表1 数据导入性能优化方式 优化方式 功能描述 相关文档 Bulk路由优化 根据Elasticsearch默认的路由规则,Bulk请求中的每一条数据会被路由到不同的shard,当索引分片较多时,
中间用英文逗号和空格分开。 集群索引重建 reindex.remote.whitelist 配置该参数可以将本集群数据通过reindex接口迁移到配置的集群,配置样例如“122.122.122.122:9200”。 自定义缓存 indices.queries.cache.size
特性,增强特性的功能和支持的集群版本请参见表1。 表1 OpenSearch集群搜索增强特性列表 增强特性 特性描述 支持的集群版本 相关文档 向量检索 向量检索支持对图像、视频、语料等非结构化数据提取的特征向量数据进行最近邻或近似近邻检索。 OpenSearch 1.3.6 向量检索特性介绍
v Tools”,进入命令执行页面。 创建生命周期策略“hot_warm_policy”。 策略定义:当索引创建3天后,自动调用冻结索引API将数据转储到OBS;索引创建7天后,删除该索引。 PUT _plugins/_ism/policies/hot_warm_policy {
入性能以及降低写入拒绝的情况。适用于索引分片较多、文本索引量大、导入吞吐量高的场景。 表1 数据导入性能优化方式 优化方式 功能描述 相关文档 Bulk路由优化 根据Elasticsearch默认的路由规则,Bulk请求中的每一条数据会被路由到不同的shard,当索引分片较多时,
中间用英文逗号和空格分开。 集群索引重建 reindex.remote.whitelist 配置该参数可以将本集群数据通过reindex接口迁移到配置的集群,配置样例如“122.122.122.122:9200”。 自定义缓存 indices.queries.cache.size
请参见云搜索服务价格计算器中的“带宽价格”。 图1给出了上述示例配置的费用计算过程。 图中价格仅供参考,实际计算请以云搜索服务价格计算器中的价格为准。 图1 包年/包月集群费用计算示例 按需计费模式下,各计费项的计费示例请参见计费示例。
Elasticsearch低于7.x版本的代码示例 POST /stconvert/type/1 { "desc": "國際電視臺" } Elasticsearch大于或等于7.x版本和OpenSearch集群的代码示例 POST /stconvert/_doc/1 {
说明 名称 自定义配置文件名称。 只能包含字母、数字、中划线或下划线,且必须以字母开头。必须大于等于4个字符。 配置文件内容 参考下面的代码示例开发配置文件内容。 说明: 配置文件内容大小不能超过100k。 隐藏内容列表 配置隐藏字符串列表后,在返回的配置内容中,会将所有在列表中的字串隐藏为“***”。
Elasticsearch低于7.x版本的代码示例 POST /stconvert/type/1 { "desc": "國際電視臺" } Elasticsearch大于或等于7.x版本和OpenSearch集群的代码示例 POST /stconvert/_doc/1 {
给用户组授权之前,请您了解用户组可以添加的CSS权限,并结合实际需求进行选择,CSS支持管理员权限和只读权限,详细的系统权限请参见权限管理。 示例流程 图1 给用户授权CSS权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予云搜索服务只读权限“CSS ReadOnlyAccess”。
7.10.2版本的集群支持。 以下示例的查询场景:查询Top10条“my_label”的值为“red”的结果。 前置过滤查询:先执行过滤条件检索,筛选出符合条件的结果;然后,对这些筛选后的候选结果进行向量相似度检索,以找出最相似的向量。 查询示例如下: POST my_index/_search
Elasticsearch 7.x之前的版本和之后的版本,操作命令有差别,所以分开举例。 Elasticsearch版本<7.x的代码示例 创建索引“book”,配置分词策略。 示例中“analyzer”和“search_analyzer”可以根据实际需要“ik_max_word”或“ik_sma
在Kibana的左侧导航中选择“Dev Tools”,进入命令执行页面。 创建生命周期策略“hot_warm_policy”。 策略定义:当索引创建3天后,自动调用冻结索引API将数据转储到OBS;当索引创建6天后关闭索引,7天后归档索引;当索引创建满30天,删除该索引。 PUT _opendistro/_ism/
Elasticsearch 7.x之前的版本和之后的版本,操作命令有差别,所以分开举例。 Elasticsearch版本<7.x的代码示例 创建索引“book”,配置分词策略。 示例中“analyzer”和“search_analyzer”可以根据实际需要“ik_max_word”或“ik_sma
云搜索服务的向量检索引擎支持对图像、视频、语料等非结构化数据提取的特征向量数据进行最近邻或近似近邻检索。详情请参见向量检索。 存算分离 云搜索服务提供冻结索引API,支持将存储在SSD的热数据转储到OBS中以降低数据的存储成本,实现存算分离。详情请参见存算分离。 流量控制 云搜索服务支持流量控制,提供
场景描述 重启集群支持快速重启和滚动重启,两种方案的使用说明请参见表1。建议在业务空闲时执行重启操作。 表1 重启方案 方案 使用说明 相关文档 快速重启 所有集群都支持。 当选择“节点类型”快速重启时,所选类型的所有节点会一起重启。 当选择“节点名称”快速重启时,一次只能重启一个节点。
场景描述 重启集群支持快速重启和滚动重启,两种方案的使用说明请参见表1。建议在业务空闲时执行重启操作。 表1 重启方案 方案 使用说明 相关文档 快速重启 所有集群都支持。 当选择“节点类型”快速重启时,所选类型的所有节点会一起重启。 当选择“节点名称”快速重启时,一次只能重启一个节点。
大于5Mbit/s:按每Mbit/s计费 请参见云搜索服务价格计算器中的“带宽价格”。 图2给出了上述示例配置的费用计算过程。 图中价格仅供参考,实际计算请以云搜索服务价格计算器中的价格为准。 图2 包年/包月集群费用计算示例 变更配置后对计费的影响 当前包年/包月集群的规格不满足您的业务需要时,您可以