這是計算機網絡相關的第一篇文章谒出。要想了解HTTP協議宦搬,必然要從最基本的計算機網絡知識開始入手带饱。本篇文章從下到上具體介紹五層經典模型毡代,極速入門計算機網絡阅羹。
經典五層模型
下面我們先來了解一下各層做的事情!
1.物理層
電腦要組網教寂,第一件事要干什么捏鱼?當然是先把電腦連起來,可以用光纜酪耕、電纜导梆、雙絞線、無線電波等方式迂烁。
這就叫做"物理層"看尼,它就是把電腦連接起來的物理手段。它主要規(guī)定了網絡的一些電氣特性盟步,作用是負責傳送0和1的電信號藏斩。
2.數據鏈路層
單純的0和1沒有任何意義,必須規(guī)定解讀方式:多少個電信號算一組址芯?每個信號位有何意義灾茁?
這就是"鏈接層"的功能,它在"實體層"的上方谷炸,確定了0和1的分組方式北专。
2.1 以太網協議
早期的時候,每家公司都有自己的電信號分組方式旬陡。逐漸地拓颓,一種叫做"以太網"(Ethernet)的協議,占據了主導地位描孟。
以太網規(guī)定驶睦,一組電信號構成一個數據包,叫做"幀"(Frame)匿醒。每一幀分成兩個部分:標頭(Head)和數據(Data)场航。
"標頭"包含數據包的一些說明項,比如發(fā)送者廉羔、接受者溉痢、數據類型等等;"數據"則是數據包的具體內容憋他。
"標頭"的長度孩饼,固定為18字節(jié)。"數據"的長度竹挡,最短為46字節(jié)镀娶,最長為1500字節(jié)。因此揪罕,整個"幀"最短為64字節(jié)梯码,最長為1518字節(jié)宝泵。如果數據很長,就必須分割成多個幀進行發(fā)送忍些。
2.2 MAC地址
上面提到鲁猩,以太網數據包的"標頭",包含了發(fā)送者和接受者的信息罢坝。那么廓握,發(fā)送者和接受者是如何標識呢?
以太網規(guī)定嘁酿,連入網絡的所有設備隙券,都必須具有"網卡"接口。數據包必須是從一塊網卡闹司,傳送到另一塊網卡娱仔。網卡的地址,就是數據包的發(fā)送地址和接收地址游桩,這叫做MAC地址牲迫。
每塊網卡出廠的時候,都有一個全世界獨一無二的MAC地址借卧,長度是48個二進制位盹憎,通常用12個十六進制數表示。
前6個十六進制數是廠商編號铐刘,后6個是該廠商的網卡流水號陪每。有了MAC地址,就可以定位網卡和數據包的路徑了镰吵。
2.3 廣播
定義地址只是第一步檩禾,后面還有更多的步驟。
首先疤祭,一塊網卡怎么會知道另一塊網卡的MAC地址盼产?
回答是有一種ARP協議,可以解決這個問題勺馆。下面介紹ARP辆飘。
其次,就算有了MAC地址谓传,系統怎樣才能把數據包準確送到接收方?
回答是以太網采用了一種很"原始"的方式芹关,它不是把數據包準確送到接收方续挟,而是向本網絡內所有計算機發(fā)送,讓每臺計算機自己判斷侥衬,是否為接收方诗祸。
上圖中跑芳,1號計算機向2號計算機發(fā)送一個數據包,同一個子網絡的3號直颅、4號博个、5號計算機都會收到這個包。它們讀取這個包的"標頭"功偿,找到接收方的MAC地址盆佣,然后與自身的MAC地址相比較,如果兩者相同械荷,就接受這個包共耍,做進一步處理,否則就丟棄這個包吨瞎。這種發(fā)送方式就叫做"廣播"(broadcasting)痹兜。
有了數據包的定義、網卡的MAC地址颤诀、廣播的發(fā)送方式字旭,"鏈接層"就可以在多臺計算機之間傳送數據了。
3.網絡層
以太網協議崖叫,依靠MAC地址發(fā)送數據遗淳。理論上,單單依靠MAC地址归露,上海的網卡就可以找到洛杉磯的網卡了洲脂,技術上是可以實現的。
但是剧包,這樣做有一個重大的缺點恐锦。以太網采用廣播方式發(fā)送數據包,所有成員人手一"包"疆液,不僅效率低一铅,而且局限在發(fā)送者所在的子網絡。也就是說堕油,如果兩臺計算機不在同一個子網絡潘飘,廣播是傳不過去的。這種設計是合理的掉缺,否則互聯網上每一臺計算機都會收到所有包卜录,那會引起災難。
互聯網是無數子網絡共同組成的一個巨型網絡眶明,很像想象上海和洛杉磯的電腦會在同一個子網絡于宙,這幾乎是不可能的活喊。
因此赃阀,必須找到一種方法,能夠區(qū)分哪些MAC地址屬于同一個子網絡柑土,哪些不是。如果是同一個子網絡绊汹,就采用廣播方式發(fā)送稽屏,否則就采用"路由"方式發(fā)送。("路由"的意思西乖,就是指如何向不同的子網絡分發(fā)數據包狐榔,這是一個很大的主題,本文不涉及浴栽。)遺憾的是荒叼,MAC地址本身無法做到這一點。它只與廠商有關典鸡,與所處網絡無關被廓。
這就導致了"網絡層"的誕生。它的作用是引進一套新的地址萝玷,使得我們能夠區(qū)分不同的計算機是否屬于同一個子網絡嫁乘。這套地址就叫做"網絡地址",簡稱"網址"球碉。
于是蜓斧,"網絡層"出現以后,每臺計算機有了兩種地址睁冬,一種是MAC地址挎春,另一種是網絡地址。兩種地址之間沒有任何聯系豆拨,MAC地址是綁定在網卡上的直奋,網絡地址則是管理員分配的,它們只是隨機組合在一起施禾。
網絡地址幫助我們確定計算機所在的子網絡脚线,MAC地址則將數據包送到該子網絡中的目標網卡。因此弥搞,從邏輯上可以推斷邮绿,必定是先處理網絡地址,然后再處理MAC地址攀例。
3.1 IP協議
規(guī)定網絡地址的協議船逮,叫做IP協議。它所定義的地址粤铭,就被稱為IP地址傻唾。
目前,廣泛采用的是IP協議第四版,簡稱IPv4冠骄。這個版本規(guī)定,網絡地址由32個二進制位組成加袋。
習慣上凛辣,我們用分成四段的十進制數表示IP地址,從0.0.0.0一直到255.255.255.255职烧。
互聯網上的每一臺計算機扁誓,都會分配到一個IP地址。這個地址分成兩個部分蚀之,前一部分代表網絡蝗敢,后一部分代表主機。比如足删,IP地址172.16.254.1寿谴,這是一個32位的地址,假定它的網絡部分是前24位(172.16.254)失受,那么主機部分就是后8位(最后的那個1)讶泰。處于同一個子網絡的電腦,它們IP地址的網絡部分必定是相同的拂到,也就是說172.16.254.2應該與172.16.254.1處在同一個子網絡痪署。
但是,問題在于單單從IP地址兄旬,我們無法判斷網絡部分狼犯。還是以172.16.254.1為例,它的網絡部分领铐,到底是前24位悯森,還是前16位,甚至前28位罐孝,從IP地址上是看不出來的呐馆。
那么,怎樣才能從IP地址莲兢,判斷兩臺計算機是否屬于同一個子網絡呢汹来?這就要用到另一個參數"子網掩碼"(subnet mask)。
所謂"子網掩碼"改艇,就是表示子網絡特征的一個參數收班。它在形式上等同于IP地址,也是一個32位二進制數字谒兄,它的網絡部分全部為1摔桦,主機部分全部為0。比如,IP地址172.16.254.1邻耕,如果已知網絡部分是前24位鸥咖,主機部分是后8位,那么子網絡掩碼就是11111111.11111111.11111111.00000000兄世,寫成十進制就是255.255.255.0啼辣。
知道"子網掩碼",我們就能判斷御滩,任意兩個IP地址是否處在同一個子網絡鸥拧。方法是將兩個IP地址與子網掩碼分別進行AND運算(兩個數位都為1,運算結果為1削解,否則為0)富弦,然后比較結果是否相同,如果是的話氛驮,就表明它們在同一個子網絡中腕柜,否則就不是。
比如柳爽,已知IP地址172.16.254.1和172.16.254.233的子網掩碼都是255.255.255.0媳握,請問它們是否在同一個子網絡?兩者與子網掩碼分別進行AND運算磷脯,結果都是172.16.254.0蛾找,因此它們在同一個子網絡。
總結一下赵誓,IP協議的作用主要有兩個打毛,一個是為每一臺計算機分配IP地址,另一個是確定哪些地址在同一個子網絡俩功。
3.2 IP數據包
根據IP協議發(fā)送的數據幻枉,就叫做IP數據包。不難想象诡蜓,其中必定包括IP地址信息熬甫。
但是前面說過,以太網數據包只包含MAC地址蔓罚,并沒有IP地址的欄位椿肩。那么是否需要修改數據定義,再添加一個欄位呢豺谈?
回答是不需要郑象,我們可以把IP數據包直接放進以太網數據包的"數據"部分,因此完全不用修改以太網的規(guī)格茬末。這就是互聯網分層結構的好處:上層的變動完全不涉及下層的結構厂榛。
具體來說,IP數據包也分為"標頭"和"數據"兩個部分。"標頭"部分主要包括版本击奶、長度辈双、IP地址等信息,"數據"部分則是IP數據包的具體內容柜砾。它放進以太網數據包后辐马,以太網數據包就變成了下面這樣。
IP數據包的"標頭"部分的長度為20個字節(jié)局义,整個數據包的總長度最大為65,535字節(jié)。因此冗疮,理論上萄唇,一個IP數據包的"數據"部分,最長為65,515字節(jié)术幔。前面說過另萤,以太網數據包的"數據"部分,最長只有1500字節(jié)诅挑。因此四敞,如果IP數據包超過了1500字節(jié),它就需要分割成幾個以太網數據包拔妥,分開發(fā)送了忿危。
3.3 ARP協議
關于"網絡層",還有最后一點需要說明没龙。
因為IP數據包是放在以太網數據包里發(fā)送的铺厨,所以我們必須同時知道兩個地址,一個是對方的MAC地址硬纤,另一個是對方的IP地址解滓。通常情況下,對方的IP地址是已知的筝家,但是我們不知道它的MAC地址洼裤。
所以,我們需要一種機制溪王,能夠從IP地址得到MAC地址腮鞍。
這里又可以分成兩種情況。第一種情況在扰,如果兩臺主機不在同一個子網絡缕减,那么事實上沒有辦法得到對方的MAC地址,只能把數據包傳送到兩個子網絡連接處的"網關"(gateway)芒珠,讓網關去處理桥狡。
第二種情況,如果兩臺主機在同一個子網絡,那么我們可以用ARP協議裹芝,得到對方的MAC地址部逮。ARP協議也是發(fā)出一個數據包(包含在以太網數據包中),其中包含它所要查詢主機的IP地址嫂易,在對方的MAC地址這一欄兄朋,填的是FF:FF:FF:FF:FF:FF,表示這是一個"廣播"地址怜械。它所在子網絡的每一臺主機颅和,都會收到這個數據包,從中取出IP地址缕允,與自身的IP地址進行比較峡扩。如果兩者相同,都做出回復障本,向對方報告自己的MAC地址教届,否則就丟棄這個包。
總之驾霜,有了ARP協議之后案训,我們就可以得到同一個子網絡內的主機MAC地址,可以把數據包發(fā)送到任意一臺主機之上了粪糙。
4. 傳輸層
有了MAC地址和IP地址强霎,我們已經可以在互聯網上任意兩臺主機上建立通信。
接下來的問題是猜旬,同一臺主機上有許多程序都需要用到網絡脆栋,比如,你一邊瀏覽網頁洒擦,一邊與朋友在線聊天椿争。當一個數據包從互聯網上發(fā)來的時候,你怎么知道熟嫩,它是表示網頁的內容秦踪,還是表示在線聊天的內容?
也就是說掸茅,我們還需要一個參數椅邓,表示這個數據包到底供哪個程序(進程)使用。這個參數就叫做"端口"(port)昧狮,它其實是每一個使用網卡的程序的編號景馁。每個數據包都發(fā)到主機的特定端口,所以不同的程序就能取到自己所需要的數據逗鸣。
"端口"是0到65535之間的一個整數合住,正好16個二進制位绰精。0到1023的端口被系統占用,用戶只能選用大于1023的端口透葛。不管是瀏覽網頁還是在線聊天笨使,應用程序會隨機選用一個端口,然后與服務器的相應端口聯系僚害。
"傳輸層"的功能硫椰,就是建立"端口到端口"的通信。相比之下萨蚕,"網絡層"的功能是建立"主機到主機"的通信靶草。只要確定主機和端口,我們就能實現程序之間的交流岳遥。因此爱致,Unix系統就把主機+端口,叫做"套接字"(socket)寒随。有了它,就可以進行網絡應用程序開發(fā)了帮坚。
4.1 UDP協議
現在妻往,我們必須在數據包中加入端口信息,這就需要新的協議试和。最簡單的實現叫做UDP協議讯泣,它的格式幾乎就是在數據前面,加上端口號阅悍。
UDP數據包好渠,也是由"標頭"和"數據"兩部分組成。
"標頭"部分主要定義了發(fā)出端口和接收端口节视,"數據"部分就是具體的內容拳锚。然后,把整個UDP數據包放入IP數據包的"數據"部分寻行,而前面說過霍掺,IP數據包又是放在以太網數據包之中的,所以整個以太網數據包現在變成了下面這樣:
UDP數據包非常簡單拌蜘,"標頭"部分一共只有8個字節(jié)杆烁,總長度不超過65,535字節(jié),正好放進一個IP數據包简卧。
4.2 TCP協議
UDP協議的優(yōu)點是比較簡單兔魂,容易實現,但是缺點是可靠性較差举娩,一旦數據包發(fā)出析校,無法知道對方是否收到构罗。
為了解決這個問題,提高網絡可靠性勺良,TCP協議就誕生了绰播。這個協議非常復雜,但可以近似認為尚困,它就是有確認機制的UDP協議蠢箩,每發(fā)出一個數據包都要求確認。如果有一個數據包遺失事甜,就收不到確認谬泌,發(fā)出方就知道有必要重發(fā)這個數據包了。
因此逻谦,TCP協議能夠確保數據不會遺失掌实。它的缺點是過程復雜、實現困難邦马、消耗較多的資源贱鼻。
TCP數據包和UDP數據包一樣,都是內嵌在IP數據包的"數據"部分滋将。TCP數據包沒有長度限制邻悬,理論上可以無限長,但是為了保證網絡的效率随闽,通常TCP數據包的長度不會超過IP數據包的長度父丰,以確保單個TCP數據包不必再分割。
關于TCP細節(jié)以后再探討掘宪。
5. 應用層
應用程序收到"傳輸層"的數據蛾扇,接下來就要進行解讀。由于互聯網是開放架構魏滚,數據來源五花八門镀首,必須事先規(guī)定好格式,否則根本無法解讀鼠次。
"應用層"的作用蘑斧,就是規(guī)定應用程序的數據格式。
舉例來說须眷,TCP協議可以為各種各樣的程序傳遞數據竖瘾,比如Email、WWW花颗、FTP等等捕传。那么,必須有不同協議規(guī)定電子郵件扩劝、網頁庸论、FTP數據的格式职辅,這些應用程序協議就構成了"應用層"。
這是最高的一層聂示,直接面對用戶域携。它的數據就放在TCP數據包的"數據"部分。因此鱼喉,現在的以太網的數據包就變成下面這樣秀鞭。
*注:UDP頭為8個字節(jié),TCP頭為20個字節(jié)
整理于:http://www.ruanyifeng.com/blog/2012/05/internet_protocol_suite_part_i.html