特性預(yù)覽:Apache 頂級(jí)項(xiàng)目 Apache Pulsar 2.6.1 版本

在正式分享 2.6.1 版本更新細(xì)節(jié)之前纠修,冉小龍首先為我們分享了兩個(gè)相關(guān) PIP 的內(nèi)容。

一個(gè)是 PIP-47 中關(guān)于「基于時(shí)間來進(jìn)行版本更新」的計(jì)劃厂僧。該 PIP 提出后扣草,從 2.5.0 版本到目前即將發(fā)布的 2.6.1 版本中,時(shí)間更短颜屠、發(fā)布頻率更高成為最突出的特點(diǎn)辰妙。同時(shí)反饋周期快,基本是每三個(gè)月更新一個(gè)大版本甫窟。這樣用戶也可以大概了解版本的一個(gè)更新周期上岗,增進(jìn)了項(xiàng)目透明度。

另一個(gè)是 PIP-69 中計(jì)劃在 Go Client 中集成 schema 相關(guān)的功能和特性蕴坪,更多詳情介紹可以參考下方:https://github.com/apache/pulsar/wiki/PIP-69%3A-Schema-design-for-Go-client

版本更新情況

此次 2.6.1 版本更新接收了來自社區(qū)的 112 次 commits敬锐,覆蓋 broker背传、Pulsar Functions、Go Function台夺、Pulsar SQL径玖、Schema、Java/CPP Client 等層面颤介。同時(shí)截止目前 Apache Pulsar 項(xiàng)目已有 6400+ star梳星、1500+ fork,以及即將超過 300 人的 contributor 數(shù)量滚朵。

接下來就簡(jiǎn)單介紹一些 2.6.1 版本中的更新功能吧冤灾。

修復(fù) Key_Shared 中 stick hash range 沖突的問題

Key_Shared 訂閱模式可以保證用戶在訂閱到某個(gè) topic 時(shí),可以指定 producer message key辕近。消息會(huì)根據(jù)指定 key 的不同韵吨,通過 hash range 有序發(fā)送到不同的 consumer。

此 PR 主要是在 broker 端添加一個(gè) check 機(jī)制移宅,來避免 stick hash range 沖突归粉。Stick hash range 的范圍是 0-65535椿疗,導(dǎo)致該錯(cuò)誤的主要原因是因?yàn)樵?broker 端,沒有對(duì) stick hash range 中的 start 和 end 位置進(jìn)行檢查糠悼。

正常情況下届榄,是不允許 start 大于 end 的位置。在 2.6.1 中倔喂,我們加入了相應(yīng)的 check 機(jī)制铝条,來避免出現(xiàn) range 沖突的問題。

在 Key_Shared 中對(duì) payload 進(jìn)行解壓縮

一般為了節(jié)約網(wǎng)絡(luò)帶寬滴劲,在創(chuàng)建 producer 時(shí)攻晒,會(huì)根據(jù)不同場(chǎng)景選擇不同的壓縮類型。Consumer 端使用了 Key_Shared 訂閱模型來訂閱 topic班挖,在消息中鲁捏,標(biāo)注消息的重要字段可能是 payload 字段。

在之前版本中是沒有針對(duì)在 Key_Shared 訂閱模式下對(duì) payload 進(jìn)行解壓縮的功能萧芙,此 PR 則是填補(bǔ)了這項(xiàng)功能给梅。

修復(fù)在關(guān)閉 consumer 時(shí)的競(jìng)態(tài)條件

根據(jù)上圖左邊圈出來的部分可以看出,message backlog 一直處于增加的狀態(tài)双揪。Backlog 就是在消息生產(chǎn)—消費(fèi)過程中动羽,沒有被 consumer 消費(fèi)掉的消息堆積,正常情況下渔期,producer 生產(chǎn)消息與 consumer 消費(fèi)消息的速率大致是一樣的运吓。但是從上圖中的遞增狀態(tài)的 backlog 就表明了,消息生產(chǎn)消費(fèi)過程中出現(xiàn)了消費(fèi)不均衡狀態(tài)疯趟。

此 PR 修復(fù)了當(dāng)宕機(jī)重啟后拘哨,消息生產(chǎn)消費(fèi)錯(cuò)開產(chǎn)生的競(jìng)態(tài)條件,做法就是在中間加一些檢查機(jī)制信峻。在 consumer 要打開一個(gè)連接時(shí)倦青,添加狀態(tài)檢查,如果當(dāng)前 connection 的狀態(tài)為 closing 或者 closed 狀態(tài)時(shí)盹舞,我們不需要發(fā)送 subscribe 的 command 到 broker 即可产镐。

使用標(biāo)準(zhǔn)主機(jī)名作為 worker 的默認(rèn)值

在 Java 8 和 Java 11 中,Get Hostname 返回的值是不一樣的踢步。即 Java 8 中返回的是標(biāo)準(zhǔn)主機(jī)名癣亚,Java 11 中返回的是簡(jiǎn)單主機(jī)名。此 PR 就是在 Java 11 中添加了可以獲取標(biāo)準(zhǔn)主機(jī)名的方法.

修復(fù) 2.6.0 引入的向后兼容問題

在 pulsar 的整個(gè)版本迭代中获印,向后兼容是一個(gè)很重要的保證逃糟。同時(shí)在是否合并 PR 的過程中也是一個(gè)十分重要的決定因素。

此 PR 中提到的向后兼容問題是由于在 2.5.0 中支持了一個(gè)功能,允許多個(gè) Pulsar cluster 去使用同一個(gè) BookKeeper 的 cluster绰咽,所以在 2.5.0 的 broker 中菇肃,會(huì)響應(yīng)帶有 BookKeeperMetadataServiceUri 的請(qǐng)求,但是 client 返回的結(jié)果卻是 null取募。

所以當(dāng) Function worker 和 broker 分開部署時(shí)琐谤,把 Function worker 和 broker 單獨(dú)從 2.5.0 更新到 2.6.0 時(shí),會(huì)返回空指針異常玩敏。

修復(fù)的方式就是在初始化 Function worker 時(shí)斗忌,對(duì) BookKeeperMetadataServiceUri 的 value 進(jìn)行檢查,判斷它是否為 null旺聚。

優(yōu)化 Pulsar Function 的加密配置

在之前的版本中织阳,F(xiàn)unction worker 與 TLS 相關(guān)的配置文件/文檔等介紹不太全面,此 PR 就是對(duì)此問題進(jìn)行了同步優(yōu)化砰粹。

主要是在 TLS transport encryption唧躲、Authentication Provider 和 Authorization Provider 上進(jìn)行了部分修改,可以大致參考下圖碱璃。

更多關(guān)于授權(quán)和認(rèn)證相關(guān)的內(nèi)容弄痹,可以參考之前 TGIP-CN 的直播 ?? 深入了解 Pulsar 認(rèn)證和授權(quán)機(jī)制

在 pulsar-perf 中支持 tlsAllowInsecureConnectio

此 PR 在 ./bin/pulsar-perf produce命令中增加了允許不信任連接的功能嵌器,作用于 producer肛真、consumer 和 reader 端。

處理在創(chuàng)建非持久性 cursor 時(shí)的錯(cuò)誤

上圖中爽航,當(dāng)用戶在創(chuàng)建非持久性 cursor 失敗時(shí)蚓让,會(huì)返回一個(gè) NPE 的 exception,這是因?yàn)楫?dāng)創(chuàng)建非持久性 cursor 失敗時(shí)讥珍,我們?nèi)匀粫?huì)去創(chuàng)建一個(gè) subscription instance 對(duì)象历极。

這將導(dǎo)致該 topic 的引用計(jì)數(shù)加一,當(dāng)用戶想要?jiǎng)h除這個(gè) topic 時(shí)串述,由于引用計(jì)數(shù)沒有被清零,所以即使使用 --force 強(qiáng)制去刪除寞肖,也刪除不掉纲酗,導(dǎo)致 topic 引用技術(shù)增加。

此 PR 就是在創(chuàng)建非持久性 cursor 失敗的時(shí)候新蟆,返回一個(gè) failedFuture 對(duì)象觅赊,而不是去創(chuàng)建一個(gè) subscription instance。

創(chuàng)建新 ledger 時(shí)引發(fā) NPE 而導(dǎo)致生產(chǎn)者卡死的問題

由于無法解析網(wǎng)絡(luò)地址琼稻,因此在創(chuàng)建 ledger 時(shí)會(huì)引發(fā) NPE吮螺。如果在添加超時(shí)任務(wù)之前引發(fā)了 NPE,則超時(shí)機(jī)制不起作用。無法解析的網(wǎng)絡(luò)地址在 Kubernetes 環(huán)境中很常見鸠补。當(dāng) bookie pod 或工作程序節(jié)點(diǎn)重新啟動(dòng)時(shí)萝风,可能會(huì)發(fā)生這種情況。

此 PR 的解決邏輯在于三個(gè)層面紫岩,即捕獲 NPE Exception规惰、觸發(fā)超時(shí)任務(wù)時(shí)執(zhí)行回調(diào)策略、以及檢測(cè) CreationLedger 的狀態(tài)泉蝌。

完善 Window Function 相關(guān)的文檔

在整個(gè)流處理數(shù)據(jù)中歇万,經(jīng)常需要以聚合方式進(jìn)行數(shù)據(jù)收集和處理,通常以時(shí)間或者是數(shù)據(jù)數(shù)量為計(jì)量單位來進(jìn)行勋陪,這種每個(gè)集合就屬于 window贪磺。

在 Pulsar Functions 中,window function 主要有三個(gè)重要概念诅愚。

  • Trigger(觸發(fā)器):決定當(dāng)前 window 何時(shí)被計(jì)算/執(zhí)行/刪除等操作寒锚。每個(gè) window 都有相應(yīng)觸發(fā)器去追蹤狀態(tài)。
  • Evictor(過濾器):當(dāng) window 被 trigger 觸發(fā)后呻粹,在 Window Function 處理之前會(huì)刪除窗口中不重要的元素壕曼。需要注意的是,Evictor 不是一個(gè)必需因素等浊,可存在可不存在腮郊。
  • Watermark(衡量線):屬于數(shù)據(jù)本身的隱藏屬性,設(shè)定一些機(jī)制筹燕,保證在某些條件下必須觸發(fā)某些狀態(tài)轧飞。

增添 OAuth2 功能

OAuth2 屬于 2.6.1 版本中新增的一個(gè)大功能。當(dāng)前 Pulsar 支持的 Authentication Providers 主要有以下幾種:

  • TLS Authentication
  • Athenz
  • Kerbos
  • JSON Web Token Authentication

整個(gè) OAuth2 相當(dāng)于授權(quán)框架/授權(quán)標(biāo)準(zhǔn)撒踪,它可以使用第三方應(yīng)用程序/客戶端獲得 HTTP 服務(wù)上的賬戶信息權(quán)限訪問过咬,通過用戶信息委派給托管用戶信息的一些服務(wù)器進(jìn)行工作。簡(jiǎn)單來說就是為外部應(yīng)用提供一個(gè)授權(quán)流程制妄,更偏向于個(gè)人定制化特色掸绞,具體操作步驟如下圖:

目前支持 OAuth2 功能的主要有:

  • Java Client(Client 版本在 2.6.1 及以上)
  • CPP Client
  • Go Client
  • pulsar-admin
  • pulsar-perf
  • pulsar-client
  • pulsarctl(CLI && admin API)

總結(jié)

此次直播主要在 Pulsar 版本更新細(xì)節(jié)中簡(jiǎn)明扼要地分享了幾個(gè)重要細(xì)節(jié),2.6.1 版本也將在未來幾天內(nèi)正式發(fā)布上線耕捞,敬請(qǐng)期待衔掸。更多直播細(xì)節(jié)可點(diǎn)擊下方視頻回放觀看:https://v.qq.com/x/page/y3137om2z9z.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末俺抽,一起剝皮案震驚了整個(gè)濱河市敞映,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌磷斧,老刑警劉巖振愿,帶你破解...
    沈念sama閱讀 211,290評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件捷犹,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡冕末,警方通過查閱死者的電腦和手機(jī)萍歉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來栓霜,“玉大人翠桦,你說我怎么就攤上這事「炻” “怎么了销凑?”我有些...
    開封第一講書人閱讀 156,872評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)仅炊。 經(jīng)常有香客問我斗幼,道長(zhǎng),這世上最難降的妖魔是什么抚垄? 我笑而不...
    開封第一講書人閱讀 56,415評(píng)論 1 283
  • 正文 為了忘掉前任蜕窿,我火速辦了婚禮,結(jié)果婚禮上呆馁,老公的妹妹穿的比我還像新娘桐经。我一直安慰自己,他們只是感情好浙滤,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,453評(píng)論 6 385
  • 文/花漫 我一把揭開白布阴挣。 她就那樣靜靜地躺著,像睡著了一般纺腊。 火紅的嫁衣襯著肌膚如雪畔咧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,784評(píng)論 1 290
  • 那天揖膜,我揣著相機(jī)與錄音誓沸,去河邊找鬼。 笑死壹粟,一個(gè)胖子當(dāng)著我的面吹牛拜隧,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播趁仙,決...
    沈念sama閱讀 38,927評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼洪添,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了幸撕?” 一聲冷哼從身側(cè)響起薇组,我...
    開封第一講書人閱讀 37,691評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤外臂,失蹤者是張志新(化名)和其女友劉穎坐儿,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,137評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡貌矿,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,472評(píng)論 2 326
  • 正文 我和宋清朗相戀三年炭菌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逛漫。...
    茶點(diǎn)故事閱讀 38,622評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡黑低,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出酌毡,到底是詐尸還是另有隱情克握,我是刑警寧澤,帶...
    沈念sama閱讀 34,289評(píng)論 4 329
  • 正文 年R本政府宣布枷踏,位于F島的核電站菩暗,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏旭蠕。R本人自食惡果不足惜停团,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,887評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望掏熬。 院中可真熱鬧佑稠,春花似錦、人聲如沸旗芬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽岗屏。三九已至辆琅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間这刷,已是汗流浹背婉烟。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留暇屋,地道東北人似袁。 一個(gè)月前我還...
    沈念sama閱讀 46,316評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像咐刨,于是被迫代替她去往敵國(guó)和親昙衅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,490評(píng)論 2 348