华为云首页用户手册

云搜索服务 CSS-优化Elasticsearch和OpenSearch集群写入性能:写入性能优化

云搜索服务 CSS-优化Elasticsearch和OpenSearch集群写入性能:写入性能优化

时间：2025-02-18 16:36:44

云搜索服务 CSS 优化Elasticsearch和OpenSearch集群性能

写入性能优化

基于Elasticsearch的数据写入流程分析，有以下几种性能优化方案。

表1 写入性能优化
优化方案	方案说明
使用SSD盘或升级集群配置	使用SSD盘可以大幅提升数据写入与merge操作的速度，对应到 CSS 服务，建议选择“超高IO型”存储，或者超高IO型主机。
采用Bulk API	客户端采用批量数据的写入方式，每次批量写入的数据建议在1~10MB之间。
随机生成_id	如果采用指定_id的写入方式，数据写入时会先触发一次查询操作，进而影响数据写入性能。对于不需要通过_id检索数据的场景，建议使用随机生成的_id。
设置合适的分片数	分片数建议设置为集群数据节点的倍数，且分片的大小控制在50GB以内。
关闭副本	数据写入与查询错峰执行，在数据写入时关闭数据副本，待数据写入完成后再开启副本。 Elasticsearch 7.x版本中关闭副本的命令如下： PUT {index}/_settings { "number_of_replicas": 0 }
调整索引的刷新频率	数据批量写入时，可以将索引的刷新频率“refresh_interval”设置为更大的值或者设置为“-1”（表示不刷新），通过减少分片刷新次数提高写入性能。 Elasticsearch 7.x版本中，将更新时间设置为15s的命令如下： PUT {index}/_settings { "refresh_interval": "15s" }
优化写入线程数与写入队列大小	为应对突发流量，可以适当地提升写入线程数与写入队列的大小，防止突发流量导致出现错误状态码为429的情况。 Elasticsearch 7.x版本中，可以修改如下自定义参数实现写入优化：thread_pool.write.size，thread_pool.write.queue_size。
设置合适的字段类型	指定集群中各字段的类型，防止Elasticsearch默认将字段猜测为keyword和text的组合类型，增加不必要的数据量。其中keyword用于关键词搜索，text用于全文搜索。对于不需要索引的字段，建议“index”设置为“false”。 Elasticsearch 7.x版本中，将字段“field1”设置为不建构索引的命令如下： PUT {index} { "mappings": { "properties": { "field1":{ "type": "text", "index": false } } } }
优化shard均衡策略	Elasticsearch默认采用基于磁盘容量大小的Load balance策略，在多节点场景下，尤其是在新扩容的节点上，可能出现shard在各节点上分配不均的问题。为避免这类问题，可以通过设置索引级别的参数“routing.allocation.total_shards_per_node”控制索引分片在各节点的分布情况。此参数可以在索引模板中配置，也可以修改已有索引的setting生效。修改已有索引的setting的命令如下： PUT {index}/_settings { "index": { "routing.allocation.total_shards_per_node": 2 } }

上一篇：云搜索服务 CSS-优化Elasticsearch和OpenSearch集群写入性能:数据写入流程

下一篇：云搜索服务 CSS-优化Elasticsearch和OpenSearch集群写入性能:数据写入流程

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

云搜索服务 CSS-优化Elasticsearch和OpenSearch集群写入性能:写入性能优化

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题