P2P網(wǎng)絡技術(shù)介紹

P2P技術(shù)屬于覆蓋層網(wǎng)絡(Overlay Network)的范疇租漂，是相對于客戶機/服務器(C/S)模式來說的一種網(wǎng)絡信息交換方式。在C/S模式中包个，數(shù)據(jù)的分發(fā)采用專門的服務器垛玻，多個客戶端都從此服務器獲取數(shù)據(jù)。

優(yōu)點是：數(shù)據(jù)的一致性容易控制泽谨，系統(tǒng)也容易管理璧榄。

缺點是：因為服務器的個數(shù)只有一個(即便有多個也非常有限)，系統(tǒng)容易出現(xiàn)單一失效點吧雹；單一服務器面對眾多的客戶端骨杂，由于CPU能力、內(nèi)存大小吮炕、網(wǎng)絡帶寬的限制腊脱，可同時服務的客戶端非常有限，可擴展性差龙亲。

P2P技術(shù)正是為了解決這些問題而提出來的一種對等網(wǎng)絡結(jié)構(gòu)陕凹。在P2P網(wǎng)絡中，每個節(jié)點既可以從其他節(jié)點得到服務鳄炉，也可以向其他節(jié)點提供服務杜耙。這樣，龐大的終端資源被利用起來拂盯，一舉解決了C/S模式中的兩個弊端佑女。

P2P應用軟件主要包括文件分發(fā)軟件、語音服務軟件谈竿、流媒體軟件团驱。目前P2P應用種類多、形式多樣空凸，沒有統(tǒng)一的網(wǎng)絡協(xié)議標準嚎花，其體系結(jié)構(gòu)和組織形式也在不斷發(fā)展。

P2P技術(shù)應用

(1)分布式科學計算

P2P技術(shù)可以使得眾多終端的CPU資源聯(lián)合起來呀洲，服務于一個共同的計算紊选。這種計算一般是計算量巨大啼止、數(shù)據(jù)極多、耗時很長的科學計算兵罢。在每次計算過程中献烦，任務(包括邏輯與數(shù)據(jù)等)被劃分成多個片，被分配到參與科學計算的P2P節(jié)點機器上卖词。在不影響原有計算機使用的前提下巩那，人們利用分散的CPU資源完成計算任務，并將結(jié)果返回給一個或多個服務器坏平，將眾多結(jié)果進行整合拢操，以得到最終結(jié)果。

(2)文件共享

BitTorrent是一種無結(jié)構(gòu)的網(wǎng)絡協(xié)議舶替。除了BitTorrent之外令境，還有不少著名的無結(jié)構(gòu)化的P2P文件共享協(xié)議，典型的有Gnutella[8]和KaZaA[6]顾瞪。

(3)流媒體直播

(4)流媒體點播

(5)IP層語音通信

Skype采取類似KaZaA的拓撲結(jié)構(gòu)舔庶，在網(wǎng)絡中選取一些超級節(jié)點。在通信雙方直連效果不好時陈醒，一些合適的超級節(jié)點則擔當起其中轉(zhuǎn)節(jié)點的角色惕橙，為通信雙方創(chuàng)建中轉(zhuǎn)連接，并轉(zhuǎn)發(fā)相應的語音通信包钉跷。

P2P實現(xiàn)的原理

首先先介紹一些基本概念：

????NAT(Network Address Translators)弥鹦，網(wǎng)絡地址轉(zhuǎn)換：網(wǎng)絡地址轉(zhuǎn)換是在IP地址日益缺乏的情況下產(chǎn)生的，它的主要目的就是為了能夠地址重用爷辙。NAT從歷史發(fā)展上分為兩大類彬坏，基本的NAT和NAPT(Network Address/Port Translator)。

?最先提出的是基本的NAT(peakflys注：剛開始其實只是路由器上的一個功能模塊)膝晾，它的產(chǎn)生基于如下事實：一個私有網(wǎng)絡（域）中的節(jié)點中只有很少的節(jié)點需要與外網(wǎng)連接（這是在上世紀90年代中期提出的）栓始。那么這個子網(wǎng)中其實只有少數(shù)的節(jié)點需要全球唯一的IP地址，其他的節(jié)點的IP地址應該是可以重用的血当。

因此幻赚，基本的NAT實現(xiàn)的功能很簡單，在子網(wǎng)內(nèi)使用一個保留的IP子網(wǎng)段臊旭，這些IP對外是不可見的落恼。子網(wǎng)內(nèi)只有少數(shù)一些IP地址可以對應到真正全球唯一的IP地址。如果這些節(jié)點需要訪問外部網(wǎng)絡离熏，那么基本NAT就負責將這個節(jié)點的子網(wǎng)內(nèi)IP轉(zhuǎn)化為一個全球唯一的IP然后發(fā)送出去领跛。(基本的NAT會改變IP包中的原IP地址，但是不會改變IP包中的端口)

關(guān)于基本的NAT可以參看RFC 1631

另外一種NAT叫做NAPT撤奸，從名稱上我們也可以看得出吠昭，NAPT不但會改變經(jīng)過這個NAT設(shè)備的IP數(shù)據(jù)報的IP地址，還會改變IP數(shù)據(jù)報的TCP/UDP端口胧瓜∈概铮基本NAT的設(shè)備可能我們見的不多（基本已經(jīng)淘汰了），NAPT才是我們真正需要關(guān)注的府喳∑牙撸看下圖：

有一個私有網(wǎng)絡10.*.*.*，Client A是其中的一臺計算機钝满，這個網(wǎng)絡的網(wǎng)關(guān)（一個NAT設(shè)備）的外網(wǎng)IP是155.99.25.11(應該還有一個內(nèi)網(wǎng)的IP地址兜粘，比如10.0.0.10)。如果Client A中的某個進程（這個進程創(chuàng)建了一個UDP Socket,這個Socket綁定1234端口）想訪問外網(wǎng)主機18.181.0.31的1235端口弯蚜，那么當數(shù)據(jù)包通過NAT時會發(fā)生什么事情呢孔轴？

首先NAT會改變這個數(shù)據(jù)包的原IP地址，改為155.99.25.11碎捺。接著NAT會為這個傳輸創(chuàng)建一個Session（Session是一個抽象的概念路鹰，如果是TCP，也許Session是由一個SYN包開始收厨，以一個FIN包結(jié)束晋柱。而UDP呢，以這個IP的這個端口的第一個UDP開始诵叁，結(jié)束呢雁竞，呵呵，也許是幾分鐘拧额，也許是幾小時碑诉，這要看具體的實現(xiàn)了）并且給這個Session分配一個端口，比如62000势腮，然后改變這個數(shù)據(jù)包的源端口為62000联贩。所以本來是

（10.0.0.1:1234->18.181.0.31:1235）的數(shù)據(jù)包到了互聯(lián)網(wǎng)上變?yōu)榱耍?55.99.25.11:62000->18.181.0.31:1235）。

一旦NAT創(chuàng)建了一個Session后捎拯，NAT會記住62000端口對應的是10.0.0.1的1234端口泪幌，以后從18.181.0.31發(fā)送到62000端口的數(shù)據(jù)會被NAT自動的轉(zhuǎn)發(fā)到10.0.0.1上。（注意：這里是說18.181.0.31發(fā)送到62000端口的數(shù)據(jù)會被轉(zhuǎn)發(fā)署照，其他的IP發(fā)送到這個端口的數(shù)據(jù)將被NAT拋棄）這樣Client A就與Server S1建立以了一個連接祸泪。

上面的是一些基礎(chǔ)知識，下面的才是關(guān)鍵的部分了建芙。

看看下面的情況：

接上面的例子没隘，如果Client A的原來那個Socket(綁定了1234端口的那個UDP Socket)又接著向另外一個Server S2發(fā)送了一個UDP包，那么這個UDP包在通過NAT時會怎么樣呢禁荸？

這時可能會有兩種情況發(fā)生右蒲，一種是NAT再次創(chuàng)建一個Session阀湿，并且再次為這個Session分配一個端口號（比如：62001）。另外一種是NAT再次創(chuàng)建一個Session瑰妄，但是不會新分配一個端口號陷嘴，而是用原來分配的端口號62000。前一種NAT叫做Symmetric NAT间坐，后一種叫做Cone NAT灾挨。如果你的NAT剛好是第一種，那么很可能會有很多P2P軟件失靈竹宋。（可以慶幸的是劳澄，現(xiàn)在絕大多數(shù)的NAT屬于后者，即Cone NAT）

peakflys注：Cone NAT具體又分為3種：

(1)全圓錐( Full Cone) : NAT把所有來自相同內(nèi)部IP地址和端口的請求映射到相同的外部IP地址和端口蜈七。任何一個外部主機均可通過該映射發(fā)送IP包到該內(nèi)部主機秒拔。

(2)限制性圓錐(Restricted Cone) : NAT把所有來自相同內(nèi)部IP地址和端口的請求映射到相同的外部IP地址和端口。但是,只有當內(nèi)部主機先給IP地址為X的外部主機發(fā)送IP包,該外部主機才能向該內(nèi)部主機發(fā)送IP包宪潮。

(3)端口限制性圓錐( Port Restricted Cone) :端口限制性圓錐與限制性圓錐類似,只是多了端口號的限制,即只有內(nèi)部主機先向IP地址為X,端口號為P的外部主機發(fā)送1個IP包,該外部主機才能夠把源端口號為P的IP包發(fā)送給該內(nèi)部主機溯警。

好了，我們看到狡相，通過NAT,子網(wǎng)內(nèi)的計算機向外連結(jié)是很容易的（NAT相當于透明的梯轻，子網(wǎng)內(nèi)的和外網(wǎng)的計算機不用知道NAT的情況）。

但是如果外部的計算機想訪問子網(wǎng)內(nèi)的計算機就比較困難了（而這正是P2P所需要的）尽棕。

那么我們?nèi)绻霃耐獠堪l(fā)送一個數(shù)據(jù)報給內(nèi)網(wǎng)的計算機有什么辦法呢喳挑？首先，我們必須在內(nèi)網(wǎng)的NAT上打上一個“洞”（也就是前面我們說的在NAT上建立一個Session）滔悉，這個洞不能由外部來打伊诵，只能由內(nèi)網(wǎng)內(nèi)的主機來打。而且這個洞是有方向的回官，比如從內(nèi)部某臺主機（比如：192.168.0.10）向外部的某個IP(比如：219.237.60.1)發(fā)送一個UDP包曹宴，那么就在這個內(nèi)網(wǎng)的NAT設(shè)備上打了一個方向為219.237.60.1的“洞”，（這就是稱為UDP Hole Punching的技術(shù)）以后219.237.60.1就可以通過這個洞與內(nèi)網(wǎng)的192.168.0.10聯(lián)系了歉提。（但是其他的IP不能利用這個洞）笛坦。

P2P的常用實現(xiàn)

一、普通的直連式P2P實現(xiàn)

通過上面的理論苔巨，實現(xiàn)兩個內(nèi)網(wǎng)的主機通訊就差最后一步了：那就是雞生蛋還是蛋生雞的問題了版扩，兩邊都無法主動發(fā)出連接請求，誰也不知道誰的公網(wǎng)地址侄泽，那我們?nèi)绾蝸泶蜻@個洞呢礁芦？我們需要一個中間人來聯(lián)系這兩個內(nèi)網(wǎng)主機。

現(xiàn)在我們來看看一個P2P軟件的流程，以下圖為例：

首先柿扣，Client A登錄服務器肖方，NAT A為這次的Session分配了一個端口60000，那么Server S收到的Client A的地址是202.187.45.3:60000未状，這就是Client A的外網(wǎng)地址了窥妇。同樣，Client B登錄Server S娩践，NAT B給此次Session分配的端口是40000，那么Server S收到的B的地址是187.34.1.56:40000烹骨。

此時翻伺，Client A與Client B都可以與Server S通信了。如果Client A此時想直接發(fā)送信息給Client B沮焕，那么他可以從Server S那兒獲得B的公網(wǎng)地址187.34.1.56:40000吨岭，是不是Client A向這個地址發(fā)送信息Client B就能收到了呢？答案是不行峦树，因為如果這樣發(fā)送信息辣辫，NAT B會將這個信息丟棄（因為這樣的信息是不請自來的，為了安全魁巩，大多數(shù)NAT都會執(zhí)行丟棄動作）〖泵穑現(xiàn)在我們需要的是在NAT B上打一個方向為202.187.45.3（即Client A的外網(wǎng)地址）的洞，那么Client A發(fā)送到187.34.1.56:40000的信息,Client B就能收到了谷遂。這個打洞命令由誰來發(fā)呢葬馋？自然是Server S。

總結(jié)一下這個過程：如果Client A想向Client B發(fā)送信息肾扰，那么Client A發(fā)送命令給Server S畴嘶，請求Server S命令Client B向Client A方向打洞。然后Client A就可以通過Client B的外網(wǎng)

地址與Client B通信了集晚。

注意：以上過程只適合于Cone NAT的情況窗悯，如果是Symmetric NAT，那么當Client B向Client A打洞的端口已經(jīng)重新分配了偷拔，Client B將無法知道這個端口（如果Symmetric NAT的端口是順序分配的蒋院，那么我們或許可以猜測這個端口號，可是由于可能導致失敗的因素太多条摸，這種情況下一般放棄P2P ?---peakflys）悦污。

二、STUN方式的P2P實現(xiàn)

STUN是RFC3489規(guī)定的一種NAT穿透方式钉蒲，它采用輔助的方法探測NAT的IP和端口切端。毫無疑問的，它對穿越早期的NAT起了巨大的作用顷啼，并且還將繼續(xù)在NAT穿透中占有一席之地踏枣。

STUN的探測過程需要有一個公網(wǎng)IP的STUN server昌屉，在NAT后面的UAC必須和此server配合，互相之間發(fā)送若干個UDP數(shù)據(jù)包茵瀑。UDP包中包含有UAC需要了解的信息间驮，比如NAT外網(wǎng)IP，PORT等等马昨。UAC通過是否得到這個UDP包和包中的數(shù)據(jù)判斷自己的NAT類型竞帽。

假設(shè)有如下UAC（B），NAT（A）鸿捧，SERVER（C）屹篓，UAC的IP為IPB，NAT的IP為 IPA 匙奴，SERVER的 IP為IPC1 堆巧、IPC2。請注意泼菌，服務器C有兩個IP谍肤，后面你會理解為什么需要兩個IP。

(1)NAT的探測過程

STEP1：B向C的IPC1的port1端口發(fā)送一個UDP包哗伯。C收到這個包后荒揣，會把它收到包的源IP和port寫到UDP包中，然后把此包通過IP1C和port1發(fā)還給B笋颤。這個IP和port也就是NAT的外網(wǎng)IP和port乳附，也就是說你在STEP1中就得到了NAT的外網(wǎng)IP。

熟悉NAT工作原理的應該都知道伴澄，C返回給B的這個UDP包B一定收到赋除。如果在你的應用中，向一個STUN服務器發(fā)送數(shù)據(jù)包后非凌，你沒有收到STUN的任何回應包举农，那只有兩種可能：1、STUN服務器不存在敞嗡，或者你弄錯了port颁糟。2、你的NAT設(shè)備拒絕一切UDP包從外部向內(nèi)部通過喉悴，如果排除防火墻限制規(guī)則棱貌，那么這樣的NAT設(shè)備如果存在，那肯定是壞了??

當B收到此UDP后箕肃，把此UDP中的IP和自己的IP做比較婚脱，如果是一樣的，就說明自己是在公網(wǎng)，下步NAT將去探測防火墻類型障贸，就不多說了(下面有圖)错森。如果不一樣，說明有NAT的存在篮洁，系統(tǒng)進行STEP2的操作涩维。

STEP2：B向C的IPC1發(fā)送一個UDP包，請求C通過另外一個IPC2和PORT（不同與SETP1的IP1）向B返回一個UDP數(shù)據(jù)包（現(xiàn)在知道為什么C要有兩個IP了吧袁波，為了檢測cone NAT的類型）瓦阐。

我們來分析一下，如果B收到了這個數(shù)據(jù)包篷牌，那說明什么垄分？說明NAT來著不拒，不對數(shù)據(jù)包進行任何過濾娃磺，這也就是STUN標準中的full cone NAT。遺憾的是叫倍，full cone nat太少了偷卧，這也意味著你能收到這個數(shù)據(jù)包的可能性不大。如果沒收到吆倦，那么系統(tǒng)進行STEP3的操作听诸。

STEP3：B向C的IPC2的port2發(fā)送一個數(shù)據(jù)包，C收到數(shù)據(jù)包后蚕泽，把它收到包的源IP和port寫到UDP包中晌梨，然后通過自己的IPC2和port2把此包發(fā)還給B。

和step1一樣须妻，B肯定能收到這個回應UDP包仔蝌。此包中的port是我們最關(guān)心的數(shù)據(jù)，下面我們來分析：

如果這個port和step1中的port一樣荒吏，那么可以肯定這個NAT是個CONE NAT敛惊，否則是對稱NAT。道理很簡單：根據(jù)對稱NAT的規(guī)則绰更，當目的地址的IP和port有任何一個改變瞧挤，那么NAT都會重新分配一個port使用，而在step3中儡湾，和step1對應特恬，我們改變了IP和port。因此徐钠，如果是對稱NAT,那這兩個port肯定是不同的癌刽。

如果在你的應用中，到此步的時候PORT是不同的，那就只能放棄P2P了妒穴，原因同上面實現(xiàn)中的一樣宋税。如果不同，那么只剩下了restrict cone 和port restrict cone讼油。系統(tǒng)用step4探測是是那一種杰赛。

STEP4：B向C的IP2的一個端口PD發(fā)送一個數(shù)據(jù)請求包，要求C用IP2和不同于PD的port返回一個數(shù)據(jù)包給B矮台。

我們來分析結(jié)果：如果B收到了乏屯，那也就意味著只要IP相同，即使port不同瘦赫，NAT也允許UDP包通過辰晕。顯然這是restrict cone NAT。如果沒收到确虱，沒別的好說含友，port restrict NAT.

參考文章：

P2P技術(shù)原理：http://www.360doc.com/content/14/0305/17/8285430_357987074.shtml

P2P技術(shù)現(xiàn)狀及發(fā)展未來：http://www.zte.com.cn/cndata/magazine/zte_communications/2007/6/magazine/200712

P2P原理及其常用的實現(xiàn)方式：http://www.cppblog.com/peakflys/archive/2013/01/25/197562.html

P2P對等網(wǎng)絡技術(shù)原理整合：?

https://blog.csdn.net/EricFantastic/article/details/49582731

p2p通信原理及實現(xiàn)：

https://blog.csdn.net/yunlianglinfeng/article/details/54018113