Kafka Streams: KStream和KTable

KStream和KTable是Kafka Streams里內建的兩個最重要的抽象,分別對應數(shù)據流和數(shù)據庫参袱。Kafka Streams作為流處理技術的一大賣點,即是很好地將存儲狀態(tài)的表(table)和作為記錄的流(stream)無縫地結合在了一起秽梅。

KStream

數(shù)據流(data stream)抹蚀,即是一段順序的,可以無限長企垦,不斷更新的數(shù)據集环壤。
數(shù)據流中比較常記錄的是事件(stream of events),這些事件可以是一次鼠標點擊(click)钞诡,一次交易郑现,或是傳感器記錄的位置數(shù)據。

KStream負責抽象的荧降,就是數(shù)據流接箫。與Kafka自身topic中的數(shù)據一樣,類似日志朵诫,每一次操作都是向其中插入(insert)新數(shù)據辛友。

KStream的構建方法:

builder.stream()

KTable

傳統(tǒng)數(shù)據庫,包含了各種存儲了大量狀態(tài)(state)的表格剪返。

KTable負責抽象的废累,就是表狀數(shù)據邓梅。每一次操作,都是更新插入(upsert)邑滨。

KTable的構建方法:

builder.table()

KStream和KTable之間的關系

事務日志記錄了所有對數(shù)據庫的更改日缨。數(shù)據庫保存了日志中最新的記錄。數(shù)據庫就是日志子集的一個緩存掖看,記錄了最新數(shù)據的子集殿遂。

KStream可以看作是KTable的更新日志(changlog),數(shù)據流中的每一個記錄對應數(shù)據庫中的每一次更新乙各。

KTable 則可以看作KStream在某一時間點墨礁,每一個key對應的最新value的快照(snapshot)。


KStream和KTable之間的相互轉換

將KTable轉換成KStream

toStream() 方法

KStream<byte[], String> stream = table.toStream();

將KStream轉換成KTable

方法1: groupByKey() + aggregation操作

KTable<String, Long> table = stream.groupByKey()
                                   .count();

方法2: 將KStream寫回Kafka耳峦,再按KTable的格式讀出

stream.to("topic0");

KTable<String, String> table = builder.table("topic0");

KStream和KTable不同的使用場景

將topic中數(shù)據經過aggregation操作后 恩静,用KTable來存儲結果。

  • KStream - 每個新數(shù)據都包含了部分信息蹲坷。
  • KTable - 每次更新都合并到原記錄上驶乾。

KTable與日志壓縮(log compaction)

日志壓縮可以作為性能提升的一種方式。
刪除舊的key value 因為不需要了循签,只保留每個key的最后一次更新级乐。
帶來的優(yōu)勢是:可以快速得到最終狀態(tài) 而不是每次更新 --- 崩潰后也只需恢復少量數(shù)據。

只應對KTable使用县匠,不該對KStream使用风科。KStream中的每條數(shù)據都包含了一部分信息,刪除會將這部分信息丟失乞旦。

需要手動在創(chuàng)建時對某個topic開啟日志壓縮: --config cleanup.policy=compact

刪除不是立刻進行的贼穆,需要等待一個delete.retention.ms周期(默認為24小時)。

是一個單獨的后臺壓縮線程兰粉,需要一定的內存開銷故痊。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市玖姑,隨后出現(xiàn)的幾起案子愕秫,更是在濱河造成了極大的恐慌,老刑警劉巖焰络,帶你破解...
    沈念sama閱讀 206,482評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件戴甩,死亡現(xiàn)場離奇詭異,居然都是意外死亡舔琅,警方通過查閱死者的電腦和手機等恐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評論 2 382
  • 文/潘曉璐 我一進店門洲劣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來备蚓,“玉大人课蔬,你說我怎么就攤上這事〗汲ⅲ” “怎么了二跋?”我有些...
    開封第一講書人閱讀 152,762評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長流昏。 經常有香客問我扎即,道長,這世上最難降的妖魔是什么况凉? 我笑而不...
    開封第一講書人閱讀 55,273評論 1 279
  • 正文 為了忘掉前任谚鄙,我火速辦了婚禮,結果婚禮上刁绒,老公的妹妹穿的比我還像新娘闷营。我一直安慰自己,他們只是感情好知市,可當我...
    茶點故事閱讀 64,289評論 5 373
  • 文/花漫 我一把揭開白布傻盟。 她就那樣靜靜地躺著,像睡著了一般嫂丙。 火紅的嫁衣襯著肌膚如雪娘赴。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,046評論 1 285
  • 那天跟啤,我揣著相機與錄音诽表,去河邊找鬼。 笑死隅肥,一個胖子當著我的面吹牛关顷,可吹牛的內容都是我干的。 我是一名探鬼主播武福,決...
    沈念sama閱讀 38,351評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼议双,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了捉片?” 一聲冷哼從身側響起平痰,我...
    開封第一講書人閱讀 36,988評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎伍纫,沒想到半個月后宗雇,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 43,476評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡莹规,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,948評論 2 324
  • 正文 我和宋清朗相戀三年赔蒲,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,064評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡舞虱,死狀恐怖欢际,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情矾兜,我是刑警寧澤损趋,帶...
    沈念sama閱讀 33,712評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站椅寺,受9級特大地震影響浑槽,放射性物質發(fā)生泄漏。R本人自食惡果不足惜返帕,卻給世界環(huán)境...
    茶點故事閱讀 39,261評論 3 307
  • 文/蒙蒙 一桐玻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧荆萤,春花似錦畸冲、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至梧油,卻和暖如春苫耸,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背儡陨。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評論 1 262
  • 我被黑心中介騙來泰國打工褪子, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人骗村。 一個月前我還...
    沈念sama閱讀 45,511評論 2 354
  • 正文 我出身青樓嫌褪,卻偏偏與公主長得像,于是被迫代替她去往敵國和親胚股。 傳聞我的和親對象是個殘疾皇子笼痛,可洞房花燭夜當晚...
    茶點故事閱讀 42,802評論 2 345

推薦閱讀更多精彩內容