以太坊源碼之 KAD路由算法(二)

一鼎姊、概念

????????常見的P2P網(wǎng)絡(luò)主要分為兩種類型:結(jié)構(gòu)化網(wǎng)絡(luò)和非結(jié)構(gòu)化網(wǎng)絡(luò)屠缭。

? ??????非結(jié)構(gòu)化的P2P網(wǎng)絡(luò)：并不給節(jié)點(diǎn)的連接覆蓋某種特定的架構(gòu)箍鼓，節(jié)點(diǎn)直接隨機(jī)連接。因?yàn)槿鄙俳Y(jié)構(gòu)呵曹，所以網(wǎng)絡(luò)面對(duì)頻繁的動(dòng)態(tài)添加和刪除結(jié)點(diǎn)時(shí)款咖，依然能夠健壯地運(yùn)行，但也正因?yàn)槿鄙俳Y(jié)構(gòu)奄喂，所以當(dāng)某個(gè)結(jié)點(diǎn)想要搜索某些數(shù)據(jù)或文件時(shí)铐殃，查詢必須flood整個(gè)網(wǎng)絡(luò)。

? ??????結(jié)構(gòu)化的P2P網(wǎng)絡(luò)：將網(wǎng)絡(luò)組織成某種特定的擴(kuò)撲結(jié)構(gòu)跨新，并且他們之間的協(xié)議能夠保證任何結(jié)點(diǎn)都能高效地搜索網(wǎng)絡(luò)中的資源富腊，即使是非常冷門的資源。常見的結(jié)構(gòu)化P2P網(wǎng)絡(luò)通常實(shí)現(xiàn)一致性哈嫌蛘剩或者其變種分布式哈希表DHT分配文件的所有權(quán)到特定的結(jié)點(diǎn)

二赘被、P2P中常見的索引方式：

????????中央索引：

????????由一個(gè)中央服務(wù)器統(tǒng)一保存資源與結(jié)點(diǎn)的關(guān)系是整。這種方式搜索效率比較高，因?yàn)榭梢酝ㄟ^中央索引直接定位到目標(biāo)結(jié)點(diǎn)民假，然而這種方式有時(shí)并不可行贰盗，特別是集群規(guī)模特別大時(shí)，無法解決單點(diǎn)故障阳欲。

????????本地索引：

????????每個(gè)結(jié)點(diǎn)保存自己的資源信息，當(dāng)尋找不屬于自己的資源時(shí)陋率，會(huì)flooding整個(gè)網(wǎng)絡(luò)進(jìn)行尋找球化。這種flooding的方式會(huì)在網(wǎng)絡(luò)中引起大量的traffic，并使每個(gè)結(jié)點(diǎn)都要處理查詢請(qǐng)求而導(dǎo)致高CPU和內(nèi)存使用率瓦糟。并且flooding不保證通信質(zhì)量筒愚，所以flooding也無法保證一定能夠找到保存指定數(shù)據(jù)的那個(gè)結(jié)點(diǎn)。因?yàn)闊釘?shù)據(jù)在多個(gè)結(jié)點(diǎn)上存在菩浙，所以比較容易搜索成功巢掺。反之，冷數(shù)據(jù)只在很少的結(jié)點(diǎn)上存在劲蜻，所以搜索很可能會(huì)以失敗告終陆淀。并且搜索效率也很低，也容易導(dǎo)致安全問題先嬉。

????????分布式索引：

????????為了高效地在網(wǎng)絡(luò)中搜索轧苫，結(jié)點(diǎn)需要保存滿足特定條件的鄰居的列表，這使得整個(gè)網(wǎng)絡(luò)在高頻率的添加刪除結(jié)點(diǎn)時(shí)疫蔓，沒有非結(jié)構(gòu)化網(wǎng)絡(luò)那樣健壯含懊。使用DHT路由的結(jié)構(gòu)化P2P網(wǎng)絡(luò)的著名軟件有BitTorrent，Kad Network衅胀，以及各種研究項(xiàng)目Chord等岔乔。基于DHT的網(wǎng)絡(luò)在網(wǎng)絡(luò)計(jì)算系統(tǒng)中也有廣泛的應(yīng)用滚躯，它幫助實(shí)現(xiàn)高效的資源發(fā)現(xiàn)和應(yīng)用程序調(diào)度等

三雏门、分布式索引--- KAD算法：

????????KAD算法全程Kademlia，在實(shí)際的DHT路由中哀九，大部分都是采用KAD這種變種來實(shí)現(xiàn)的剿配，BT、eDonkey/電驢阅束、eMule/電騾呼胚， I2P 暗網(wǎng)等等，其中以太坊中也采用KAD算法來實(shí)現(xiàn)路由的息裸。

(一)蝇更、"最短距離"的概念

????????當(dāng)從P2P網(wǎng)絡(luò)中查詢某一條數(shù)據(jù)時(shí)沪编，為了避免泛洪查找，首先要定位到離數(shù)據(jù)的KEY最近的一個(gè)節(jié)點(diǎn)年扩，然后從該節(jié)點(diǎn)上提取所需要的數(shù)據(jù)蚁廓。那么這個(gè)最短距離如何確定呢？

????????首先厨幻，我們獲取到P2P中所有節(jié)點(diǎn)的nodeId相嵌，經(jīng)過hash算法，表示成某一固定長度的二進(jìn)制接口况脆。同理饭宾，用同樣的hash對(duì)數(shù)據(jù)key進(jìn)行hash并表示為二進(jìn)制。然后對(duì)數(shù)據(jù)key和nodeId計(jì)算其異或距離格了，找到其中距離最小值就是我們的最短距離看铆。

????????假如hash完后的數(shù)據(jù)二進(jìn)制長度為3位，并且存在4臺(tái)服務(wù)器盛末。 data key的值為101弹惦，按照data key 和node id的同構(gòu)原理，應(yīng)該是尋找節(jié)點(diǎn)101悄但，但是該節(jié)點(diǎn)不存在棠隐，故需要尋找距離最短的節(jié)點(diǎn)，也就是100節(jié)點(diǎn)檐嚣。故應(yīng)該從nodeId = 100這臺(tái)機(jī)器上查詢當(dāng)前的數(shù)據(jù)宵荒。

注意：這里的距離并非真實(shí)的距離，而是邏輯距離净嘀。

(二)报咳、邏輯拓?fù)浣Y(jié)構(gòu) 和 K-Buckets K桶

????????在P2P的網(wǎng)絡(luò)中，每個(gè)節(jié)點(diǎn)都保存了其他節(jié)點(diǎn)的信息挖藏。當(dāng)我請(qǐng)求其中一個(gè)節(jié)點(diǎn)時(shí)暑刃，該節(jié)點(diǎn)如何快速的定位到數(shù)據(jù)是位于哪個(gè)節(jié)點(diǎn)上呢？那么其他節(jié)點(diǎn)信息在當(dāng)前節(jié)點(diǎn)中如何存儲(chǔ)膜眠，這就是邏輯拓?fù)浣Y(jié)構(gòu)要解決的問題了岩臣。

????????現(xiàn)在假如 nodeId 經(jīng)過hash后的位數(shù)還是3位，那么理論上整個(gè)網(wǎng)絡(luò)中就可以存在2^3 = 8 個(gè)節(jié)點(diǎn)宵膨。節(jié)點(diǎn)包括：

001架谎，010，011辟躏，000谷扣，100，101捎琐，110会涎，111

????????我們將每個(gè)節(jié)點(diǎn)的表示為二進(jìn)制后裹匙，按照左0右1構(gòu)建如下二叉樹。其中不難發(fā)現(xiàn)末秃，所有的葉子節(jié)點(diǎn)就是我們的服務(wù)器節(jié)點(diǎn)概页。如下圖

????????如圖，當(dāng)前節(jié)點(diǎn)為101练慕，那么該節(jié)點(diǎn)如何存儲(chǔ)其他節(jié)點(diǎn)惰匙，以方便快速定位呢？這里采用分層铃将。

????????首先計(jì)算每個(gè)節(jié)點(diǎn)與當(dāng)前節(jié)點(diǎn)101的距離徽曲，按照一定距離進(jìn)行分層。

? ??????分層規(guī)則: 定義從最右位開始麸塞，第一次開始出現(xiàn)不同位時(shí)，則表示為同一層涧衙。

????????按照入上規(guī)則進(jìn)行分層哪工，可以看出，第一層與當(dāng)前節(jié)點(diǎn)的距離是最短的弧哎，層數(shù)越高雁比，節(jié)點(diǎn)到當(dāng)前節(jié)點(diǎn)的距離越遠(yuǎn)。

????????此時(shí)撤嫩，如果當(dāng)前節(jié)點(diǎn)接收到查詢請(qǐng)求偎捎，先將數(shù)據(jù)的key 按照同樣的hash算法，然后表示為二進(jìn)制序攘，假如data key = 100 茴她。首先將data key 與當(dāng)前節(jié)點(diǎn) nodeId = 101 進(jìn)行距離計(jì)算(異或)，其中異或結(jié)果就代表了當(dāng)前數(shù)據(jù)節(jié)點(diǎn)所在的層程奠。 100 ^101 = 1 丈牢，故存儲(chǔ)數(shù)據(jù)的節(jié)點(diǎn)在第一層，然后定位到100節(jié)點(diǎn)瞄沙，向100節(jié)點(diǎn)發(fā)送查詢請(qǐng)求己沛。

????????此時(shí)可以發(fā)現(xiàn)，不用利用泛洪式查找就能快速定位到資源所在的位置距境。加入現(xiàn)在資源定位在第3層申尼，那么我只要遍歷二叉樹中的左面四個(gè)節(jié)點(diǎn)就可以，避免了遍歷整個(gè)子樹的問題垫桂。

? ??????K-Buckets:

????????由于我們舉例中的節(jié)點(diǎn)只有三位师幕，但是現(xiàn)實(shí)中龐大的集群網(wǎng)絡(luò)節(jié)點(diǎn)可能會(huì)存在上萬個(gè)節(jié)點(diǎn)。比如以太坊中的位數(shù)為256位诬滩，那么網(wǎng)絡(luò)中理論上就可以存在2^256個(gè)節(jié)點(diǎn)们衙。

????????當(dāng)網(wǎng)絡(luò)中節(jié)點(diǎn)的數(shù)量不斷擴(kuò)張時(shí)钾怔，不可能在每個(gè)節(jié)點(diǎn)上都存儲(chǔ)所有其他節(jié)點(diǎn)的信息。從上例也可以看出蒙挑，位數(shù)的增加宗侦，層數(shù)也不斷增加，而越高層存儲(chǔ)的信息也就越多忆蚀。

? ??????所以 Kad 論文中給出了一個(gè)“K-桶(K-bucket)”的概念矾利。也就是說：每個(gè)節(jié)點(diǎn)在完成子樹拆分后，要記錄每個(gè)子樹里面的 K 個(gè)節(jié)點(diǎn)馋袜。這里所說的 K 值是一個(gè)【系統(tǒng)級(jí)】的常量男旗。

????????也就是說每一層，我們最多存儲(chǔ)K個(gè)節(jié)點(diǎn)欣鳖。因?yàn)橹灰喇?dāng)前子樹的一個(gè)節(jié)點(diǎn)察皇，理論上我們就可以知道并能夠遍歷當(dāng)前子樹的所有節(jié)點(diǎn)。那為什么不存儲(chǔ)一個(gè)呢泽台？因?yàn)榉植际较碌墓?jié)點(diǎn)的動(dòng)態(tài)變化的什荣，如果當(dāng)前節(jié)點(diǎn)宕機(jī)，就會(huì)影響該子樹怀酷。故可以根據(jù)系統(tǒng)自身的特性來調(diào)整K值的大小稻爬。比如BT設(shè)定K = 8, 以太坊中設(shè)定為16.

????????其中，每層中存儲(chǔ)的節(jié)點(diǎn)的順序是按照與當(dāng)前節(jié)點(diǎn)的由近及遠(yuǎn)來存儲(chǔ)的蜕依。

(三)桅锄、KAD節(jié)點(diǎn)的更新機(jī)制

????????當(dāng)節(jié)點(diǎn) 收到一個(gè) PRC 消息時(shí)，發(fā)送者B的節(jié)點(diǎn)信息就被用來更新對(duì)應(yīng)的 K 桶样眠，具體步驟如下：

????????1友瘤、計(jì)算發(fā)送者節(jié)點(diǎn)與當(dāng)前節(jié)點(diǎn)的距離。

????????2檐束、根據(jù)距離選擇位于K桶第幾層

????????3商佑、如果發(fā)送者B已經(jīng)存在于K桶中，則移動(dòng)B節(jié)點(diǎn)到最前面

????????4厢塘、如果B不在K桶中茶没，且桶中數(shù)量小于K個(gè)，則添加B節(jié)點(diǎn)信息到K桶末尾

????????5晚碾、如果B不在K桶中抓半，且桶中的數(shù)據(jù)量大于K個(gè)，先給桶中末尾節(jié)點(diǎn)發(fā)送PING消息：

????????????????????????????????如果收到回復(fù)格嘁，則忽略B節(jié)點(diǎn)笛求。

????????????????????????????????如果未收到回復(fù)，則刪除末尾節(jié)點(diǎn)，加入B節(jié)點(diǎn)探入。

????????原因如下:?

?????????????K 桶的更新機(jī)制的實(shí)現(xiàn)依賴于一個(gè)理論：用戶在線時(shí)間越長狡孔，它在下一時(shí)段繼續(xù)在線的可能性就越高。? ??? ??這種機(jī)制的另一個(gè)好處是能在一定程度上防御 DOS 攻擊蜂嗽，因?yàn)橹挥挟?dāng)老節(jié)點(diǎn)失效后苗膝，Kad 才會(huì)更新 K 桶的信息，這就避免了通過新節(jié)點(diǎn)的加入來泛洪路由信息植旧。

(四)辱揭、KAD的UDP通信協(xié)議：

? ? ? ? 1、PING事件:? 校驗(yàn)節(jié)點(diǎn)是否存活

? ? ? ? 2病附、PONG事件：對(duì)PING事件的回復(fù)

????????3问窃、FIND_NODE事件：向節(jié)點(diǎn)查詢某個(gè)與目標(biāo)節(jié)點(diǎn)ID距離接近的節(jié)點(diǎn)

????????4、NEIGHBORS事件：對(duì)FIND_NODE命令響應(yīng)完沪，發(fā)送與目標(biāo)節(jié)點(diǎn)ID距離接近的K桶中的節(jié)點(diǎn)域庇。

(五)、KAD的路由查詢機(jī)制：

????????假如集群中的某個(gè)節(jié)點(diǎn)A收到一個(gè)FIND_NODE請(qǐng)求覆积，要求查詢與ID為m的節(jié)點(diǎn)最近的節(jié)點(diǎn)信息,具體的步驟如下：

????????1听皿、計(jì)算當(dāng)前A節(jié)點(diǎn)ID與M的距離：

????????2、鎖定到K桶的層技健，并從中獲取aplha個(gè)節(jié)點(diǎn)，如果節(jié)點(diǎn)數(shù)不足alpha惰拱，則從附近的桶中獲取節(jié)點(diǎn)雌贱。

????????3、同時(shí)向alpha個(gè)節(jié)點(diǎn)發(fā)送FIND_NODE請(qǐng)求偿短。

????????4欣孤、接收到FIND_NODE的節(jié)點(diǎn)，如果發(fā)現(xiàn)自己的ID是m則返回昔逗。從自己K桶中選擇距離最近的alpha個(gè)節(jié)點(diǎn)返回降传。

????????5、當(dāng)節(jié)點(diǎn)A接收到返回的數(shù)據(jù)時(shí)勾怒，如果有m則返回婆排，如果沒有m，則再次向返回的alpha個(gè)節(jié)點(diǎn)發(fā)送FIND_NODE請(qǐng)求繼續(xù)查找笔链，如此循環(huán)段只，直至遍歷完所有的節(jié)點(diǎn)。

????????其中在BitTorrent和以太坊中設(shè)定alpha = 3鉴扫。

????????原因如下：

????????????????由于每次查詢都能從更接近 m 的 K 桶中獲取信息赞枕，這樣的機(jī)制保證了每一次遞歸操作都能夠至少獲得距離減半（或距離減少 1 bit）的效果，從而保證整個(gè)查詢過程的收斂速度為?O(logN)?，這里 N 為網(wǎng)絡(luò)全部節(jié)點(diǎn)的數(shù)量炕婶。

? ??????????????借用網(wǎng)絡(luò)上一張圖描述其查找的過程:

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末姐赡，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子柠掂，更是在濱河造成了極大的恐慌项滑，老刑警劉巖，帶你破解...
沈念sama閱讀 222,681評(píng)論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件陪踩，死亡現(xiàn)場離奇詭異杖们，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)肩狂，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,205評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門摘完，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人傻谁，你說我怎么就攤上這事孝治。” “怎么了审磁？”我有些...
開封第一講書人閱讀 169,421評(píng)論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵谈飒，是天一觀的道長。經(jīng)常有香客問我态蒂，道長杭措，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 60,114評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任钾恢，我火速辦了婚禮手素，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘瘩蚪。我一直安慰自己泉懦，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 69,116評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布疹瘦。她就那樣靜靜地躺著崩哩，像睡著了一般。火紅的嫁衣襯著肌膚如雪言沐。梳的紋絲不亂的頭發(fā)上邓嘹，一...
開封第一講書人閱讀 52,713評(píng)論 1贊 312
城市分裂傳說
那天，我揣著相機(jī)與錄音险胰，去河邊找鬼吴超。笑死，一個(gè)胖子當(dāng)著我的面吹牛鸯乃，可吹牛的內(nèi)容都是我干的鲸阻。我是一名探鬼主播跋涣，決...
沈念sama閱讀 41,170評(píng)論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢(mèng)啊……” “哼鸟悴！你這毒婦竟也來了陈辱？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 40,116評(píng)論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤细诸，失蹤者是張志新（化名）和其女友劉穎沛贪，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體震贵，經(jīng)...
沈念sama閱讀 46,651評(píng)論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡利赋，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,714評(píng)論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了猩系。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片媚送。...
茶點(diǎn)故事閱讀 40,865評(píng)論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖寇甸，靈堂內(nèi)的尸體忽然破棺而出塘偎，到底是詐尸還是另有隱情，我是刑警寧澤拿霉，帶...
沈念sama閱讀 36,527評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布吟秩，位于F島的核電站，受9級(jí)特大地震影響绽淘，放射性物質(zhì)發(fā)生泄漏涵防。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,211評(píng)論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一沪铭、第九天我趴在偏房一處隱蔽的房頂上張望壮池。院中可真熱鬧，春花似錦伦意、人聲如沸火窒。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,699評(píng)論 0贊 25
一樁弒父案驮肉，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至已骇，卻和暖如春离钝，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背褪储。一陣腳步聲響...
開封第一講書人閱讀 33,814評(píng)論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工卵渴，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人鲤竹。一個(gè)月前我還...
沈念sama閱讀 49,299評(píng)論 3贊 379
代替公主和親
正文我出身青樓浪读，卻偏偏與公主長得像昔榴，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子碘橘，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,870評(píng)論 2贊 361