云服务器内容精选

  • 业务影响 单节点使用率超过85%:会导致新的分片无法分配。 单节点使用率超过90%:Elasticsearch会尝试将对应节点中的分片迁移到其他磁盘使用率比较低的数据节点中。 单节点使用率超过95%:系统会对Elasticsearch集群中对应节点里每个索引强制设置“read_only_allow_delete”属性,此时该节点上的所有索引将无法写入数据,只能读取和删除对应索引。 单节点使用率过高,可通过扩容操作动态调整集群节点的数量和容量。新扩容的节点不会立即分配索引,可打开cerebro看下节点索引分配情况,做进一步观察,也可以修改“indices.recovery.max_bytes_per_sec”和“cluster.routing.allocation.cluster_concurrent_rebalance”两个参数值增加索引分配速度。
  • 日常需要关注 CSS 服务的哪些监控指标? 日常需要关注 CS S服务的磁盘使用率和集群健康状态。用户可以登录到 云监控服务 ,根据实际应用场景配置告警提示,当收到告警,可采取相应措施消除告警。告警配置方法,请参见配置告警规则。 配置示例: 如果在某段时间内(如5min),磁盘使用率出现多次(如5次)不低于某特定值(如85%)的情况,则发出相应告警。 如果在某段时间内(如5min),集群健康状态出现多次(如5次)大于0的情况,则发出相应告警。 采取措施: 收到与磁盘使用率有关的告警时,可以调查磁盘空间消耗,查看是否可以从集群节点中删除数据或是将数据存档到其他系统以释放空间,或者扩容磁盘。 收到与集群健康状态有关的告警时,可以查看集群的分片分配是否正常以及Shard是否已丢失,在Cerebro上查看进程是否发生重启。 父主题: CSS集群监控与运维