Pulsar Flink Connector 2.5.0 正式發(fā)布

經過不斷地努力购岗,社區(qū)成功發(fā)布 Pulsar Flink Connector 2.5.0 版本。Pulsar Flink Connector 集成了 Apache Pulsar 和 Apache Flink(數據處理引擎)潦嘶,允許 Apache Flink 向 Apache Pulsar 讀寫數據。

下面將詳細介紹 Pulsar Flink Connector 2.5.0 引入的新特性檩奠,希望能夠幫助大家更好地理解 Pulsar Flink Connector 掐松。

背景

Flink 是一款快速發(fā)展的分布式計算引擎,在 1.11 版本中罢杉,支持以下新特性:

  • 核心引擎引入了非對齊的 Checkpoint 機制趟畏。這一機制明顯改善了 Flink 容錯機制,它可以提高嚴重反壓作業(yè)的 Checkpoint 速度滩租。

  • 提供一套新的 Source 接口赋秀。通過統(tǒng)一流和批作業(yè) Source 的運行機制利朵,支持常用的內部實現,如事件時間處理猎莲、watermark 生成和空閑并發(fā)檢測绍弟。這套新的 Source 接口可以極大地降低開發(fā)新 Source 的復雜度。

  • Flink SQL 支持變動數據捕獲(Change Data Capture著洼,CDC)樟遣。它使 Flink 可以方便地通過像 Debezium 這類工具來翻譯和消費數據庫的變動日志。Table API 和 SQL 也有助于文件系統(tǒng)連接器支持更多用戶場景和格式身笤,從而支持將流式數據從 Pulsar 寫入 Hive 等場景豹悬。

  • PyFlink 優(yōu)化多個部分的性能,包括支持向量化的用戶自定義函數(Python UDF)液荸。這些改動使 Flink Python 接口可以與常用的 Python 庫(如 Pandas 和 NumPy)進行相互操作瞻佛,從而使 Flink 更適合數據處理與機器學習的場景。

在新版本發(fā)布后娇钱,為了讓小伙伴們盡快使用支持 Flink 1.11 的 Pulsar Flink Connector伤柄,我們對新版 Pulsar Flink Connector 進行了升級。

我們發(fā)現這次升級難度很大忍弛,問題在于 Flink 新版本對于公開 API 的支持有增減(基礎的 FieldsDataType 類型、StreamTableEnvironment 包變更和 execute 方法的變化)考抄、Table 檢查 Schema 操作變更為啟動時檢查细疚、連接器運行時轉換為 Catalog,直接使新舊版本不兼容川梅。

經過多方考量疯兼,我們最終決定新增pulsar-flink-1.11 模塊來支持 Flink 1.11。在這里非常感謝 BIGO 團隊的陳航贫途、吳展鵬吧彪,為社區(qū)貢獻了 Flink 1.11 的兼容升級技術支持。

Pulsar Schema 包含消息的類型結構信息丢早,它可以很好地和 Flink Table 進行集成姨裸。在 Flink 1.9 時,SQL 類型可以綁定物理類型怨酝,用于 Pulsar 的 SchemaType傀缩。

但是在 Flink 1.11,Table 變更后农猬,SQL 類型只能使用默認的物理類型赡艰,Pulsar 的 SchemaType 不支持 Flink 日期、事件的默認物理類型斤葱。我們?yōu)?Pulsar Schema 添加了新的原生類型慷垮,使 Pulsar Schema 可以和 Flink SQL 類型系統(tǒng)集成起來揖闸。

Pulsar Flink Connector 新特性詳解

以下是 Pulsar Flink Connector 2.5.0 中添加的一些主要的功能。

pulsar-flink

?? 支持 Flink 1.11 和 flink-sql DDL

Flink 1.11 版本升級的幅度較大料身,一些公共 API 發(fā)生了增刪汤纸,導致 Flink 1.9、Flink 1.11 的 Pulsar 連接器無法做到兼容惯驼。本次變更使項目分為兩個模塊蹲嚣,來支持不同版本的 Flink。BIGO 的陳航祟牲、吳展鵬童鞋為此特性付出了很大的努力隙畜。

  • 支持 Flink 1.11 版本

  • 新增 Flink-sql DDL 支持

  • 更新 topic 分區(qū)策略,使消費更均勻

  • Flink 1.11 兼容 Pulsar schema

有關實現的更多信息说贝,請參見 PR-115议惰。

??添加 PulsarDeserializationSchema 接口

抽象 PulsarDeserializationSchema 接口,使用戶可以自定義解碼乡恕,獲得更多源信息言询。

有關實現的更多信息,請參見 PR-95傲宜。

貢獻者:@wuzhanpeng

??Flink Sink 增加 JSON 支持

Flink Sink 實現中运杭,Pulsar Schema 類型支持 JSON 。

有關實現的更多信息函卒,請參見 PR-116辆憔。

貢獻者:@jianyun8023

??PulsarCatalog 變更為基于 GenericInMemoryCatalog 實現

PulsarCatalog 的實現變更為繼承GenericInMemoryCatalog。

有關實現的更多信息报嵌,請參見 PR-91虱咧。

貢獻者:@sijie

Pulsar Schema

??增加 Java 8 時間、日期類型到 Pulsar Schema 的原生類型

為 Pulsar Schema 增加 Java 8 常用的 Instant锚国、LocalDate腕巡、LocalTime、LocalDateTime 等類型支持血筑。
有關實現的更多信息绘沉,請參見PR-7874

貢獻者:@jianyun8023

總結

Pulsar Flink Connector 2.5.0 的發(fā)布豺总,對于這個快速發(fā)展的項目來說梆砸,是一個大的里程碑。在此特別感謝為本次版本發(fā)布做出貢獻的陳航园欣、吳展鵬帖世、郭斯杰、趙建云。

如果你有好的想法或想成為項目貢獻者日矫,歡迎提交 ISSUE 至 https://github.com/streamnative/pulsar-flink/issues赂弓,也可以參考我們的貢獻指南

相關鏈接

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末哪轿,一起剝皮案震驚了整個濱河市盈魁,隨后出現的幾起案子,更是在濱河造成了極大的恐慌窃诉,老刑警劉巖杨耙,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異飘痛,居然都是意外死亡珊膜,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進店門宣脉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來车柠,“玉大人,你說我怎么就攤上這事塑猖≈竦唬” “怎么了?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵羊苟,是天一觀的道長塑陵。 經常有香客問我,道長蜡励,這世上最難降的妖魔是什么令花? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮巍虫,結果婚禮上彭则,老公的妹妹穿的比我還像新娘鳍刷。我一直安慰自己占遥,他們只是感情好,可當我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布输瓜。 她就那樣靜靜地躺著瓦胎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪尤揣。 梳的紋絲不亂的頭發(fā)上搔啊,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天,我揣著相機與錄音北戏,去河邊找鬼负芋。 笑死,一個胖子當著我的面吹牛嗜愈,可吹牛的內容都是我干的旧蛾。 我是一名探鬼主播莽龟,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼锨天!你這毒婦竟也來了毯盈?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤病袄,失蹤者是張志新(化名)和其女友劉穎搂赋,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體益缠,經...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡脑奠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了左刽。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捺信。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖欠痴,靈堂內的尸體忽然破棺而出迄靠,到底是詐尸還是另有隱情,我是刑警寧澤喇辽,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布掌挚,位于F島的核電站,受9級特大地震影響菩咨,放射性物質發(fā)生泄漏吠式。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一抽米、第九天 我趴在偏房一處隱蔽的房頂上張望特占。 院中可真熱鬧,春花似錦云茸、人聲如沸是目。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽懊纳。三九已至,卻和暖如春亡容,著一層夾襖步出監(jiān)牢的瞬間嗤疯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工闺兢, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留茂缚,地道東北人。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像脚囊,于是被迫代替她去往敵國和親帖汞。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,627評論 2 350