11. Forwarding (2)

前段時(shí)間有幸和國內(nèi)的同行們交流了一番奈应,發(fā)現(xiàn)形勢大好定躏。云挥转,openstack,VMWare共屈,SDN都開始有repeatable use case出現(xiàn)了绑谣,技術(shù)落地也越來越扎實(shí)。這是好事拗引,大家加油借宵。

這篇文章會用上篇文章中的概念繼續(xù)聊如何在多租戶數(shù)據(jù)中心里進(jìn)行數(shù)據(jù)包的轉(zhuǎn)發(fā)。在聊具體方案之前矾削,大家先嘗試回答一下這個(gè)問題:如果你是當(dāng)初第一個(gè)設(shè)計(jì)多租戶數(shù)據(jù)中心轉(zhuǎn)發(fā)平面的架構(gòu)師壤玫,openstack上的一個(gè)租戶起了一個(gè)router,你會如何實(shí)現(xiàn)這個(gè)router呢哼凯?想清楚這個(gè)問題欲间,多租戶數(shù)據(jù)中心數(shù)據(jù)平面的大框架就有了,剩下的都是在為這個(gè)大框架添磚加瓦断部,小修小補(bǔ)猎贴。目前工業(yè)界有兩大類方案,overlay和fabric蝴光。這兩個(gè)方案完全不同她渴,而他們之所以不同的最根本原因就是對上面這個(gè)問題的答案不同。

Overlay

這類方案的設(shè)計(jì)者是這樣回答以上問題的:既然用戶在orchestration系統(tǒng)上起了一個(gè)router蔑祟,那我們也對應(yīng)起一個(gè)router就好了趁耗。問題是這個(gè)router應(yīng)該起在哪兒呢?在一臺服務(wù)器上起一個(gè)軟件router是最直接的選擇(在多租戶的概念剛興起的時(shí)候疆虚,這甚至是唯一的選擇)苛败。于是這個(gè)orchestration系統(tǒng)中邏輯上的router就和一臺軟件router一一對應(yīng)了。這臺軟件router很自然的便成了那個(gè)租戶所有subnet的default gateway径簿。一個(gè)很自然的問題便是:如果一個(gè)租戶的vm和router不在同一臺物理服務(wù)器上罢屈,那這個(gè)vm要如何才能夠和這個(gè)router實(shí)現(xiàn)二層互聯(lián)呢?兩個(gè)最容易想到的選擇便是:1) 通過配置vlan直接實(shí)現(xiàn)二層互聯(lián)牍帚,2) 通過隧道實(shí)現(xiàn)layer2 over layer3儡遮。選項(xiàng)1)在實(shí)踐中一直是一個(gè)很頭疼的問題:給定任意的拓普乳蛾,都能夠動態(tài)的配置vlan暗赶,trunk和STP鄙币,這是整個(gè)網(wǎng)絡(luò)行業(yè)解決了20年都沒有解決好的問題。于是選項(xiàng)2)成了唯一的選擇蹂随。

接下來的故事就非常順理成章了:vxlan應(yīng)運(yùn)而生十嘿,用來打隧道以及通過VNI來區(qū)分更多數(shù)量的租戶;一個(gè)軟件router沒有HA岳锁,于是先引入VRRP做冗余绩衷,之后是DVR;軟件router的性能可能會成為瓶頸激率,于是DPDK相關(guān)的技術(shù)又迎來了春天咳燕。

博主還是堅(jiān)持一直以來的觀點(diǎn):所有的技術(shù)都是上層應(yīng)用驅(qū)動的。如果最初的架構(gòu)師們對以上那個(gè)問題給出了不同的答案乒躺,vxlan招盲,DVR,DPDK這些技術(shù)就很可能不會有今天這樣火爆了嘉冒。

Fabric

這類方案的設(shè)計(jì)者對以上那個(gè)黑體字問題的回答完全不同:這個(gè)router應(yīng)該實(shí)現(xiàn)在交換機(jī)上曹货,因?yàn)檫@是交換機(jī)的專長。既然在多租戶的數(shù)據(jù)中心里subnet并不和機(jī)架綁定讳推,一個(gè)IP可能被orchestration系統(tǒng)分配到任何位置顶籽,那么這個(gè)router就應(yīng)該分布式的實(shí)現(xiàn)在所有交換機(jī)上。

這是一個(gè)非常合理同時(shí)也非常大膽的回答银觅。我們先來看看在這樣的回答之下礼饱,一臺交換機(jī)究竟在扮演怎樣的角色。我們首先把目光關(guān)注在第一跳的交換機(jī)上 (如果是VM究驴,那這第一跳交換機(jī)就是一臺軟件交換機(jī)慨仿;如果是bare metal服務(wù)器,那這第一跳交換機(jī)就是一臺硬件交換機(jī))纳胧。不管是軟件還是硬件交換機(jī)镰吆,如果服務(wù)器發(fā)出的是二層報(bào)文,這臺交換機(jī)就應(yīng)該能夠進(jìn)行二層轉(zhuǎn)發(fā)/廣播跑慕;如果服務(wù)器發(fā)ARP要gateway的mac万皿,這臺交換機(jī)就應(yīng)該做ARP reply;如果服務(wù)器發(fā)出的是三層報(bào)文核行,這臺交換機(jī)就應(yīng)該能夠進(jìn)行三層轉(zhuǎn)發(fā)牢硅。例子舉到這里,大家就會發(fā)現(xiàn)在fabric的解決方案里芝雪,一臺交換機(jī)究竟是二層還是三層已經(jīng)變得模糊减余,數(shù)據(jù)的轉(zhuǎn)發(fā)平面需要進(jìn)行精心的設(shè)計(jì)。在這類解決方案當(dāng)中惩系,最具代表性的是Big Cloud Fabric位岔。

比較到這里如筛,兩類方案最大的區(qū)別就講清楚了:在overlay方案里,default gateway往往在某一臺物理服務(wù)器上抒抬;在fabric方案里杨刨,default gateway在第一跳的交換機(jī)上。不少方案就是在這兩種極端的解決方案之間尋找一個(gè)折中:比如有些方案會把tunnel打在硬件交換機(jī)上擦剑,用來保證性能以及滿足bare metal用戶的需求妖胀。關(guān)于兩種方案的優(yōu)劣,博主之前已經(jīng)聊了不少(文章4惠勒,文章10)赚抡。從各個(gè)角度來看,博主依然堅(jiān)定的認(rèn)為fabric是在技術(shù)上更加優(yōu)秀的方案纠屋。在之后的文章中怕品,博主會對fabric方案中,default gateway之后究竟會發(fā)生什么進(jìn)行進(jìn)一步討論巾遭。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肉康,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子灼舍,更是在濱河造成了極大的恐慌吼和,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件骑素,死亡現(xiàn)場離奇詭異炫乓,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)献丑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進(jìn)店門末捣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人创橄,你說我怎么就攤上這事箩做。” “怎么了妥畏?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵邦邦,是天一觀的道長。 經(jīng)常有香客問我醉蚁,道長燃辖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任网棍,我火速辦了婚禮黔龟,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己氏身,他們只是感情好巍棱,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著观谦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪桨菜。 梳的紋絲不亂的頭發(fā)上豁状,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天,我揣著相機(jī)與錄音倒得,去河邊找鬼泻红。 笑死,一個(gè)胖子當(dāng)著我的面吹牛霞掺,可吹牛的內(nèi)容都是我干的谊路。 我是一名探鬼主播,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼菩彬,長吁一口氣:“原來是場噩夢啊……” “哼缠劝!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起骗灶,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤惨恭,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后耙旦,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體脱羡,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年免都,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了锉罐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,769評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡绕娘,死狀恐怖脓规,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情险领,我是刑警寧澤抖拦,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站舷暮,受9級特大地震影響态罪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜下面,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一复颈、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦耗啦、人聲如沸凿菩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽衅谷。三九已至,卻和暖如春似将,著一層夾襖步出監(jiān)牢的瞬間获黔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工在验, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留玷氏,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓腋舌,卻偏偏與公主長得像盏触,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子块饺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 好久沒有更新文章了赞辩,因?yàn)楣驹诒锎笳小I现蹷ig Cloud Fabric 3.0終于登場授艰,博主這才得空诗宣。先在這里...
    xinwu閱讀 1,205評論 1 5
  • 相信不少兄弟的SDN啟蒙都是各種高大上的論文中五花八門的概念和應(yīng)用,等到真把開源控制器和mininet裝好想诅,要開始...
    xinwu閱讀 2,760評論 6 15
  • 第一章 OpenStack基礎(chǔ) OpenStack管理的資源及提供的服務(wù)OpenStack做為一個(gè)操作系統(tǒng)召庞,...
    sgt_tiger閱讀 12,918評論 4 72
  • 1. OSI,TCP/IP来破,五層協(xié)議的體系結(jié)構(gòu)篮灼,以及各層協(xié)議 OSI分層 (7層):物理層、數(shù)據(jù)鏈路層徘禁、...
    iCaptain閱讀 2,467評論 0 4
  • 寂靜無聲的夜晚里诅诱,我找不到自己丟失的靈魂,我似乎把它落在了你那里送朱,可是任憑我怎么呼喚自己的靈魂娘荡,它都不愿意回...
    KristyShen閱讀 219評論 0 0