Kafka auto.offset.reset 設定解說

Posted on  Nov 21, 2018  in  資訊技術探索  by  Amo Chen  ‐ 1 min read

海邊的 Kafka 與 Python 系列文章中,有提到關於 Consumer commit 的概念與實作,不過沒有提到一個重要的 Consumer 設定 auto.offset.reset

auto.offset.reset 有 3 種設定:

  1. latest
  2. earliest
  3. none

上述 3 項設定在以下 2 種情況的 Consumer 會有不同的行為:

  1. 沒有任何 commit 的 Consumer (e.g. 剛加入且有新群組名稱的 consumer)
  2. 已有 commit 的 Consumer (e.g. 因故重新啟動的 consumer)

latest

沒有任何 commit 的 Consumer 使用 latest 的設定時, Kafka 會直接給 Consumer 最新 1 則的訊息(message) 。

已有 commit 的 Consumer, Kafka 則會從已 commit 之後的訊息開始派送給 Consumer 。

earliest

沒有任何 commit 的 Consumer 使用 earliest 的設定時, Kafka 會從訊息佇列(message queue)最舊的訊息開始派送給 Consumer 。

已有 commit 的 Consumer, Kafka 則會從已 commit 之後的訊息開始派送給 Consumer 。

none

沒有任何 commit 的 Consumer 使用 none 的設定時, Consumer 就會直接拋出 exception 。

已有 commit 的 Consumer, Kafka 則會從已 commit 之後的訊息開始派送給 Consumer 。

總結

如果 consumer 是需要從最早的訊息開始消化的情況,建議使用 earliest

如果不需要,則使用 latest 即可。

References

https://kafka.apache.org/documentation/

追蹤新知

看完這篇文章了嗎?還意猶未盡的話,追蹤粉絲專頁吧!

我們每天至少分享 1 篇文章/新聞或者實用的軟體/工具,讓你輕鬆增廣見聞提升專業能力!如果你喜歡我們的文章,或是想了解更多特定主題的教學,歡迎到我們的粉絲專頁按讚、留言讓我們知道。你的鼓勵,是我們的原力!

贊助我們的創作

看完這篇文章了嗎? 休息一下,喝杯咖啡吧!

如果你覺得 MyApollo 有讓你獲得實用的資訊,希望能看到更多的技術分享,邀請你贊助我們一杯咖啡,讓我們有更多的動力與精力繼續提供高品質的文章,感謝你的支持!