分布式消息服务Kafka版-扩容/缩容过程中生产消息失败

时间:2023-11-01 16:23:06

扩容/缩容过程中生产消息失败

可能原因:在扩容/缩容代理规格的过程中,代理采用滚动重启的方式进行实例变更。在重启过程中,分区Leader会进行切换,此时生产客户端的元数据缓存中保存的分区Leader为旧分区Leader ID,仍然会向旧分区Leader发送消息,导致生产消息失败。

解决方法:在生产客户端配置重试机制。建议设置retries=Integer.MAX_VALUE

support.huaweicloud.com/kafka_faq/kafka_faq_0056.html