10. Forwarding (1)

好久沒有更新文章了派阱,因為公司在憋大招。上周Big Cloud Fabric 3.0終于登場,博主這才得空蝗砾。先在這里做三個廣告:

1. Big Cloud Fabric 3.0在歷時兩年的開發(fā)之后,終于問世携冤。博主有幸參與了整個產品的設計悼粮,開發(fā)和測試。產品非常扎實曾棕,與openstack和vmware無縫結合扣猫。歡迎大家上手一試

2. 伴隨產品的發(fā)布,我們還發(fā)布了新的定價方式 elastic SDN pricing, 這種定價方式開了兩個先例:首先翘地,網絡設備的軟件和硬件價格全面公開申尤,這還是行業(yè)內的第一次癌幕。第二,彈性收費終于開始進入到了數(shù)據(jù)中心的日常運營昧穿。

3. 博主今年十月份會回國一個月勺远,主要在上海北京兩地轉悠,希望有機會和同行交流时鸵,歡迎大家私信胶逢。

廣告做完,開始正文寥枝。如何在SDN網絡中轉發(fā)數(shù)據(jù)包是一個太大的話題宪塔,博主想借兩到三篇文章聊一聊在一個多租戶數(shù)據(jù)中心里一個數(shù)據(jù)包是如何轉發(fā)的,博主見識有限囊拜,純粹盲人摸象某筐,歡迎大家查漏補缺。

博主首先要科普一下現(xiàn)在被絕大多數(shù)數(shù)據(jù)中心解決方案所采用的多租戶模型冠跷。(1) 一個租戶(tenant)可以創(chuàng)建一個或者多個logical router南誊,(2) 這個租戶還可以創(chuàng)建多個subnet,一個subnet可以接入到某個logical router上蜜托,(3) 一個subnet內的通信往往在2層抄囚,而同一個logical router上兩個subnet之間的通信則需要logical router作為default gateway進行轉發(fā)。(4) 如果兩個subnet接入到不同的logical router橄务,它們之間的通信有兩種方式:a.將兩個logical router以某種方式相連幔托,并在每個logical router上配置相應的路由。b. 借助NAT或者floating IP蜂挪,讓logical router進行IP地址轉換重挑。

目前絕大多數(shù)多租戶數(shù)據(jù)中心解決方案都在向以上的用戶模型靠攏,原因也很顯然:這幾乎是最簡單的網絡模型了棠涮,簡單到任何一個數(shù)據(jù)中心的租戶都不應該對該模型產生絲毫的理解困難谬哀。但是這種簡潔的用戶模型,往往意味著復雜的實現(xiàn)严肪,最大的困難緣于在這個模型中邏輯網絡和物理網絡是完全無關的史煎,也就是說我們要找到一個方法將邏輯網絡中的各個要素映射到物理網絡上,理解了這個映射也就為理解數(shù)據(jù)包轉發(fā)奠定了基礎驳糯。

就博主有限的知識儲備篇梭,目前工業(yè)界從邏輯網絡到物理網絡的映射方案分兩大類:overlay和fabric。博主這里先梳理一下那些構成邏輯網絡的最基本要素酝枢,以及這些要素在兩類方案中是如何映射到物理網絡上的很洋。

Port

一個port是指一個bare metal server或者VM的網卡與網絡相連接的地方,從邏輯上講它只有四個最關鍵的屬性:tenant, network, IP和mac隧枫。租戶其實并不在乎這個port究竟在物理網絡的什么位置喉磁。但所有SDN網絡解決方案卻需要清楚的知道如何把這個邏輯上的port映射到物理物理網絡上:這個port究竟在哪個OVS上谓苟,或者在哪臺物理交換機上?是否有vlan tag协怒?有時候人們還會在port的基礎之上采用一些冗余備份的技術(比如bond), 這樣在邏輯port向物理port映射時涝焙,就需要追加更多的信息。如果大家在玩兒openstack孕暇,會發(fā)現(xiàn)neutron數(shù)據(jù)庫里的port table是最復雜的一張表仑撞,原因就在于它將關于一個port邏輯上和物理上的所有信息都放在了一起。

Subnet

在傳統(tǒng)的數(shù)據(jù)中心里妖滔,subnet和物理網絡是嚴格耦合的:處于同一個rack的port會被劃分到同一個subnet里隧哮。但在多租戶的數(shù)據(jù)中心里,subnet與物理網絡完全解耦合:屬于同一個subnet的兩個port無論出現(xiàn)在物理網絡的任何位置座舍,它們都應該能夠直接在2層通信沮翔。這是多租戶數(shù)據(jù)中心最特別的地方,也是overlay和fabric兩類解決方案的根本區(qū)別所在曲秉。overlay方案采用隧道技術(比如vxlan, GRE)采蚀,fabric則將整個網絡當作一臺distributed switch(比如Big Cloud Fabric)。兩類方案的技術細節(jié)博主會在下篇文章中詳細分析承二。

Router

多個subnet的互聯(lián)互通是需要router作為default gateway的榆鼠。對于overlay方案而言,邏輯上的router和物理上的router是簡單的一對一映射亥鸠,這個router往往需要多個功能:隧道的封裝/解封裝妆够,路由,NAT以及floating IP负蚊。這也就是為什么絕大多數(shù)的overlay方案往往都需要采購一些功能齊全并且?guī)捵銐虻膔outer做為解決方案的一部分神妹。而fabric方案,是把整個網絡當作一個distributed router盖桥,網絡當中的各個switch都可以完成路由灾螃,NAT以及floating IP的功能题翻。兩類方案的技術細節(jié)同樣會在之后的文章中詳細分析揩徊。

以上只是初步涉及了port,subnet和router三個最關鍵的網絡要素在overlay和fabric兩種解決方案中是如何從邏輯概念映射到物理概念的嵌赠。對于那些更復雜的要素塑荒,博主目前只有些零散的觀察和想法,等有系統(tǒng)的觀點之后會陸續(xù)分享姜挺,這里先把它們寫下來以防忘掉:L2 service insertion, L3 service insertion, L4-L7 service insertion, multicast, dynamic routing protocol齿税。

在開始后續(xù)文章之前,博主想先提一句:博主堅定的認為fabric方案是技術上更優(yōu)秀的選擇炊豪,因為它在三個方面完勝overlay:第一凌箕,價格拧篮,請參見博主的第四篇文章。第二牵舱,性能串绩。分布式的硬件轉發(fā)和路由最大程度的避免了overlay方案中由于軟件封裝,解封裝以及路由帶來的性能瓶頸芜壁。博主知道有很多兄弟會在這點上持反對意見礁凡,于是列出幾個事實先:cisco和vmware都推出了在TOR交換機上進行隧道封裝和解封裝的方案,opencontrail全棄用了OVS而開發(fā)了自己的virtual switch來提高性能慧妄,這其中的原因不言自明顷牌。第三,在overlay方案中塞淹,troubleshooting簡直是一場災難窟蓝。首先,overlay網絡和物理網絡是分別管理的窖铡,任何一個網絡故障都需要兩方面的工程獅聯(lián)合調試疗锐。其次,即便聯(lián)合調試费彼,一旦一個數(shù)據(jù)包被封裝好進入物理網絡滑臊,我們便再也無法識別這個數(shù)據(jù)包了,除非在物理網絡上花大價錢進行Deep Packet Inspection箍铲。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末雇卷,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子颠猴,更是在濱河造成了極大的恐慌关划,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件翘瓮,死亡現(xiàn)場離奇詭異贮折,居然都是意外死亡,警方通過查閱死者的電腦和手機资盅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進店門调榄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人呵扛,你說我怎么就攤上這事每庆。” “怎么了今穿?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵缤灵,是天一觀的道長。 經常有香客問我,道長腮出,這世上最難降的妖魔是什么帖鸦? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮胚嘲,結果婚禮上富蓄,老公的妹妹穿的比我還像新娘。我一直安慰自己慢逾,他們只是感情好立倍,可當我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著侣滩,像睡著了一般口注。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上君珠,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天寝志,我揣著相機與錄音,去河邊找鬼策添。 笑死材部,一個胖子當著我的面吹牛,可吹牛的內容都是我干的唯竹。 我是一名探鬼主播乐导,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼浸颓!你這毒婦竟也來了物臂?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤产上,失蹤者是張志新(化名)和其女友劉穎棵磷,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晋涣,經...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡仪媒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了谢鹊。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片算吩。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖撇贺,靈堂內的尸體忽然破棺而出赌莺,到底是詐尸還是另有隱情冰抢,我是刑警寧澤松嘶,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站挎扰,受9級特大地震影響翠订,放射性物質發(fā)生泄漏巢音。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一尽超、第九天 我趴在偏房一處隱蔽的房頂上張望官撼。 院中可真熱鬧,春花似錦似谁、人聲如沸傲绣。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽秃诵。三九已至,卻和暖如春塞琼,著一層夾襖步出監(jiān)牢的瞬間菠净,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工彪杉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留毅往,地道東北人。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓派近,卻偏偏與公主長得像攀唯,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子渴丸,可洞房花燭夜當晚...
    茶點故事閱讀 43,465評論 2 348

推薦閱讀更多精彩內容

  • 前段時間有幸和國內的同行們交流了一番革答,發(fā)現(xiàn)形勢大好。云曙强,openstack残拐,VMWare,SDN都開始有repea...
    xinwu閱讀 857評論 0 3
  • 有些朋友一看這個問題可能會有些不知所云,如果SDN控制器不管物理交換機娜扇,那么它管什么呢错沃?答案是只管理虛擬交換機。這...
    xinwu閱讀 3,635評論 7 22
  • 寶寶今年又大了一歲雀瓢,但是說話依舊很雷人枢析,同時也給我們帶來了無限的樂趣。 一天刃麸,我和寶寶在外面吃飯醒叁,吃飯的地方離家有...
    柳絮XM閱讀 282評論 4 4
  • 你做過意志力訓練么把沼?比如21天連續(xù)寫作啊易、100天連續(xù)早起、365天每天記日記饮睬。 是不是堅持一段就不堅持了租谈? 今天看...
    饞人小博閱讀 578評論 2 1
  • Snapseed是一款相片處理軟件,任何人均可輕松美化捆愁、轉換和分享其相片割去。特別是Snapseed被google收之...
    紙影閱讀 3,367評論 0 35