您现在的位置是：首页 > 数据库

当前栏目

kafka---为什么kafka中1个partition只能被同组的一个consumer消费?

Kafka 消息

2023-04-18 16:25:58 时间

Kafka中每一个客户端的offset是由自己进行维护的，kafka并没有对同一个消费组中每个消费者的offset做中心化处理，所以如果他们消费同一个partition 都分别用自己的offset 会出现重复消费的问题。

offset是什么？

offset

partition中的每条消息都被标记了一个序号，每个序号都是连续的，这个序号表示消息在partition中的偏移量，称为offset，每一条消息在partition都有唯一的offset。

offset从语义上来看有两种：Current offset 和 committed offset

Current offset

Cuttent offset 保存在客户端中由客户端自己维护，它表示消费者希望收到下一条消息的序号，它仅仅在poll()方法中使用，例如：消费者第一次调用poll()方法收到了20条消息，那么 cuttent offset的值将被设置成20 下一次poll时，kafka就知道要从序号为21的消息开始读取，这样能保证消费者每次poll消息时，收到的消息不重复

Committed offset

Committed Offset保存在Broker上 (V0.9之后的版本)，它表示Consumer已经确认消费过的消息的序号。主要通过commitSync()来操作。举例:Consumer通过poll()方法收到20条消息后，此时Current Offset就是20，经过一系列的逻辑处理后，并没有调用commitSync()来提交
Committed Offset，那么此时Committed Offset依旧是0。
Committed Offset主要用于Consumer Rebalance(再平衡)。在Consumer Rebalance的过程中，一个Partition被分配给了一个Consumer，那么这个Consumer该从什么位置开始消费消息呢?答案就是Committed Offset。另外，如果一个Consumer消费了5条消息.(poll并且成功commitSync)之后宕机了，重新启动之后，它仍然能够从第6条消息开始消费，因为Committed Offset已经被Kafka记录为5。
Committed Offset是为了每一个消费组进行记录的不同的消费者组分别记录

小结：

Current offset 是针对消费者 poll过程为了保证每次poll都返回不重复的消息

Committed offset 是为了 Consumer Rebalance(再平衡) 的你过程，它能够保证同一个消费者组中新的消费者在正确的位置开始消费，避免重复消费。

同一消费组内多个消费者同时消费会出现重复消费。例如A1 1-10 POS 10

A2 10-20 POS 20

下次消费的时候 A1是 11-20重复消费

解决方案

假设broker对index进行维护。但是consumer 是进行pull操作的，拉取操作一般来说都是由拉取方提供index，数据方根据index 返回数据。如果由数据方维护index，会增加获取index 的通信开销。
假设consumer端进行多人的index维护，那么就得引入中心的概念，大家都在中心去获得当前的index，这会增加复杂性。
在consumer端维护单人index，可以方便的pull数据。牺牲了分区的分布式消费。由于可以有多个分区，权衡之下是较为合理的方案。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

kafka---为什么kafka中1个partition只能被同组的一个consumer消费?

相关文章