检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
是管理大规模数据集和优化存储成本的有效方式。 需要存储大量历史数据:当需要存储大量不常访问但对分析有用的历史数据时,使用冷数据节点可以提供成本效益较高的存储解决方案。 需要优化热数据性能:通过将旧数据迁移到冷数据节点,可以减少对热数据节点的存储压力,从而优化热数据的查询和写入性能。
配置Elasticsearch集群聚合增强 场景描述 聚合增强在数据聚簇的情况下,利用向量化技术,批量处理数据,从而提升聚合性能,优化可观测性业务的聚合分析能力。 在大规模数据的集聚合分析场景下,耗时主要集中在对数据的分组聚合。 提升分组聚合能力依赖排序键和聚簇键。 排序键:数据按照排序键顺序存储。
Elasticsearch是一个高度可扩展的开源搜索和分析引擎,支持用户通过自定义规则对搜索结果进行排序。自定义排序允许开发者根据业务需求,定义特定的排序规则,以优化搜索结果的相关性和用户体验。该方案可以用于以下场景: 电子商务:根据销量、用户评价、价格等因素对商品进行排序。 内容管理:根据阅读量、发布时间对文章或博客帖子进行排序。
07 实践 此模块为您提供多种使用场景的操作指导。 迁移Elasticsearch集群 Elasticsearch集群迁移 优化集群性能 写入性能优化 查询性能优化 实践案例 使用CSS加速数据库的查询分析 使用CSS搭建统一日志管理平台 使用Elasticsearch集群自定义评分查询
随着上云企业越来越多,企业对用云成本问题也越发重视。使用云搜索服务时,如何进行成本管理,减轻业务负担呢?本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用云搜索服务时,成本主要包含各类
大条数? 解决方案 方法1: 打开Kibana,在DevTools界面执行如下命令: PUT _all/_settings?preserve_existing=true { "index.max_result_window" : "10000000" } 方法2: 在服务器执行如下命令进行设置(以非安全集群为例):
"es_rejected_execution_exception" } 问题分析 引起bulk reject的大多原因是shard容量过大或shard分配不均,具体可通过以下方法进行定位分析。 检查分片(shard)数据量是否过大。 单个分片数据量过大,可能引起Bulk Reject,建议单个分片大小控制在20GB
指定待查询的集群ID,获取方法请参见获取集群ID。 约束限制: 不涉及 取值范围: 获取方法请参见获取集群ID。 默认取值: 不涉及 cluster_id 是 String 参数解释: 指定待查询的集群ID,获取方法请参见获取集群ID。 约束限制: 不涉及 取值范围: 获取方法请参见获取集群ID。
包括Kibana、Cerebro、Curl命令。 优化集群性能 优化Elasticsearch和OpenSearch集群写入性能 集群在使用前,建议参考本实践进行集群的写入性能优化,便于提高集群的写入性能,提升使用效率。 优化Elasticsearch和OpenSearch集群查询性能
h集群 High Level Client是在Low Level Client基础上进行封装的,如果High Level Client中的方法调用(例如“.search”,“.bulk”)不能满足使用需求,或存在兼容性问题,可以选择使用Low Level Client方式,甚至可以使用“HighLevelClient
Write队列中总排队任务数示例 如果集群存在大量的任务堆积,则参考如下步骤优化集群。 在集群的“日志管理”页面查看节点日志,查看节点在OOM前是否存在大量慢查询日志记录,分析查询是否会对节点造成压力导致节点内存不足,如果存在则根据业务实际情况优化查询语句。 在集群的“日志管理”页面查看节点日志,查看节点日志是否有“Inflight
配置OpenSearch集群向量检索 向量检索特性介绍 在OpenSearch集群创建向量索引 在OpenSearch集群使用向量索引搜索数据 优化向量检索写入与查询性能 管理向量索引缓存 向量检索的客户端代码示例(Python) 向量检索的客户端代码示例(Java) 父主题: 增强OpenSearch集群搜索能力
向量检索特性介绍 在Elasticsearch集群创建向量索引 在Elasticsearch集群使用向量索引搜索数据 在嵌套字段中使用向量索引 优化向量检索写入与查询性能 管理向量索引缓存 向量检索的客户端代码示例(Python) 向量检索的客户端代码示例(Java) 父主题: 增强Elasticsearch集群搜索能力
首先根据调用栈可以定位到报错来自CloseableHttpAsyncClientBase中的90行,如下图所示: ensureRunning()方法是在每次请求执行开始的时候调用,用来确认client状态是否为ACTIVE,如果不是ACTIVE,则会报错。然后观察CloseableHt
10.2 配置Elasticsearch集群大查询隔离 聚合增强 聚合增强在数据聚簇的情况下,利用向量化技术,批量处理数据,从而提升聚合性能,优化可观测性业务的聚合分析能力。 Elasticsearch 7.10.2 配置Elasticsearch集群聚合增强 读写分离 读写分离支持
同版本升级:老旧同版本升级到最新的同版本,比如20年7.6.2版本可升级到23年7.6.2版本。同版本升级是升级集群的内核补丁,用于修复问题或优化性能。 跨版本升级:低版本跨版本升级到高版本。跨版本升级是升级集群的版本,用于功能加强或版本收编。 跨引擎升级(构建中):支持从Elast
该接口用于查询并显示集群列表以及集群的状态。 调用方法 请参见如何调用API。 URI GET /v1.0/{project_id}/clusters 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 参数解释: 项目ID。获取方法请参见获取项目ID和名称。 约束限制:
获取集群ID 在调用接口的时候,部分URL中需要填入集群ID(cluster_id),所以需要获取到集群ID。获取方法如下所示: 调用API获取集群ID 集群ID可以通过调用查询集群列表API接口获取。 获取集群ID的接口为“GET https://{Endpoint}/v1.0
查看集群监控,排查集群的写入和查询任务相关指标。 如果集群长期处于高堆内存占用状态,查看集群节点个数、节点规模,确认是否需要扩容。 解决方案 根据任务堆积现象优化客户端写入或查询程序。 根据业务情况,如果集群长期处于高负载状态,则集群会存在写入、查询缓慢,节点频繁掉线等情况。需要根据需要扩容节点规模,或分业务重新规划集群规模。
索引算法。仅当“indexing”为“true”时生效。 可选值: FLAT:暴力计算,目标向量依次和所有向量进行距离计算,此方法计算量大,召回率100%。适用于对召回准确率要求极高的场景。 GRAPH:图索引,内嵌深度优化的HNSW算法,主要应用在对性能和精度均有较高要求且单shard中文档数量在千万个以内的场景。