區(qū)塊鏈(blockchain)是眼下的大熱門,新聞媒體大量報道祭玉,宣稱它將創(chuàng)造未來氧映。
可是,簡單易懂的入門文章卻很少脱货。區(qū)塊鏈到底是什么岛都,有何特別之處,很少有解釋振峻。
下面臼疫,我就來嘗試,寫一篇最好懂的區(qū)塊鏈教程扣孟。畢竟它也不是很難的東西烫堤,核心概念非常簡單,幾句話就能說清楚。我希望讀完本文鸽斟,你不僅可以理解區(qū)塊鏈拔创,還會明白什么是挖礦、為什么挖礦越來越難等問題富蓄。
需要說明的是剩燥,我并非這方面的專家。雖然很早就關注立倍,但是仔細地了解區(qū)塊鏈灭红,還是從今年初開始。文中的錯誤和不準確的地方口注,歡迎大家指正变擒。
一、區(qū)塊鏈的本質
區(qū)塊鏈是什么寝志?一句話赁项,它是一種特殊的分布式數據庫。
首先澈段,區(qū)塊鏈的主要作用是儲存信息悠菜。任何需要保存的信息,都可以寫入區(qū)塊鏈败富,也可以從里面讀取悔醋,所以它是數據庫。
其次兽叮,任何人都可以架設服務器芬骄,加入區(qū)塊鏈網絡,成為一個節(jié)點鹦聪。區(qū)塊鏈的世界里面账阻,沒有中心節(jié)點,每個節(jié)點都是平等的泽本,都保存著整個數據庫淘太。你可以向任何一個節(jié)點,寫入/讀取數據规丽,因為所有節(jié)點最后都會同步蒲牧,保證區(qū)塊鏈一致。
二赌莺、區(qū)塊鏈的最大特點
分布式數據庫并非新發(fā)明冰抢,市場上早有此類產品。但是艘狭,區(qū)塊鏈有一個革命性特點挎扰。
區(qū)塊鏈沒有管理員翠订,它是徹底無中心的。其他的數據庫都有管理員遵倦,但是區(qū)塊鏈沒有尽超。如果有人想對區(qū)塊鏈添加審核,也實現不了骇吭,因為它的設計目標就是防止出現居于中心地位的管理當局橙弱。
正是因為無法管理歧寺,區(qū)塊鏈才能做到無法被控制燥狰。否則一旦大公司大集團控制了管理權,他們就會控制整個平臺斜筐,其他使用者就都必須聽命于他們了龙致。
但是,沒有了管理員顷链,人人都可以往里面寫入數據目代,怎么才能保證數據是可信的呢?被壞人改了怎么辦嗤练?請接著往下讀榛了,這就是區(qū)塊鏈奇妙的地方。
三煞抬、區(qū)塊
區(qū)塊鏈由一個個區(qū)塊(block)組成霜大。區(qū)塊很像數據庫的記錄,每次寫入數據革答,就是創(chuàng)建一個區(qū)塊战坤。
每個區(qū)塊包含兩個部分。
- 區(qū)塊頭(Head):記錄當前區(qū)塊的特征值
- 區(qū)塊體(Body):實際數據
區(qū)塊頭包含了當前區(qū)塊的多項特征值残拐。
- 生成時間
- 實際數據(即區(qū)塊體)的哈希
- 上一個區(qū)塊的哈希
- ...
這里途茫,你需要理解什么叫哈希(hash),這是理解區(qū)塊鏈必需的溪食。
所謂"哈希"就是計算機可以對任意內容囊卜,計算出一個長度相同的特征值。區(qū)塊鏈的 哈希長度是256位错沃,這就是說边败,不管原始內容是什么,最后都會計算出一個256位的二進制數字捎废。而且可以保證笑窜,只要原始內容不同,對應的哈希一定是不同的登疗。
舉例來說排截,字符串123
的哈希是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0
(十六進制)嫌蚤,轉成二進制就是256位,而且只有123
能得到這個哈希断傲。(理論上脱吱,其他字符串也有可能得到這個哈希,但是概率極低认罩,可以近似認為不可能發(fā)生箱蝠。)
因此,就有兩個重要的推論垦垂。
- 推論1:每個區(qū)塊的哈希都是不一樣的宦搬,可以通過哈希標識區(qū)塊。
- 推論2:如果區(qū)塊的內容變了劫拗,它的哈希一定會改變间校。
四、 Hash 的不可修改性
區(qū)塊與哈希是一一對應的页慷,每個區(qū)塊的哈希都是針對"區(qū)塊頭"(Head)計算的憔足。也就是說,把區(qū)塊頭的各項特征值,按照順序連接在一起,組成一個很長的字符串碑隆,再對這個字符串計算哈希。
Hash = SHA256( 區(qū)塊頭 )
上面就是區(qū)塊哈希的計算公式揭绑,SHA256
是區(qū)塊鏈的哈希算法。注意稳析,這個公式里面只包含區(qū)塊頭洗做,不包含區(qū)塊體,也就是說彰居,哈希由區(qū)塊頭唯一決定诚纸,
前面說過,區(qū)塊頭包含很多內容陈惰,其中有當前區(qū)塊體的哈希畦徘,還有上一個區(qū)塊的哈希。這意味著抬闯,如果當前區(qū)塊體的內容變了井辆,或者上一個區(qū)塊的哈希變了,一定會引起當前區(qū)塊的哈希改變溶握。
這一點對區(qū)塊鏈有重大意義杯缺。如果有人修改了一個區(qū)塊,該區(qū)塊的哈希就變了睡榆。為了讓后面的區(qū)塊還能連到它(因為下一個區(qū)塊包含上一個區(qū)塊的哈希)萍肆,該人必須依次修改后面所有的區(qū)塊袍榆,否則被改掉的區(qū)塊就脫離區(qū)塊鏈了。由于后面要提到的原因塘揣,哈希的計算很耗時包雀,短時間內修改多個區(qū)塊幾乎不可能發(fā)生,除非有人掌握了全網51%以上的計算能力亲铡。
正是通過這種聯動機制才写,區(qū)塊鏈保證了自身的可靠性,數據一旦寫入奖蔓,就無法被篡改赞草。這就像歷史一樣,發(fā)生了就是發(fā)生了锭硼,從此再無法改變房资。
每個區(qū)塊都連著上一個區(qū)塊蜕劝,這也是"區(qū)塊鏈"這個名字的由來檀头。
五、采礦
由于必須保證節(jié)點之間的同步岖沛,所以新區(qū)塊的添加速度不能太快暑始。試想一下,你剛剛同步了一個區(qū)塊婴削,準備基于它生成下一個區(qū)塊廊镜,但這時別的節(jié)點又有新區(qū)塊生成,你不得不放棄做了一半的計算唉俗,再次去同步嗤朴。因為每個區(qū)塊的后面,只能跟著一個區(qū)塊虫溜,你永遠只能在最新區(qū)塊的后面雹姊,生成下一個區(qū)塊。所以衡楞,你別無選擇吱雏,一聽到信號,就必須立刻同步瘾境。
所以歧杏,區(qū)塊鏈的發(fā)明者中本聰(這是假名,真實身份至今未知)故意讓添加新區(qū)塊迷守,變得很困難犬绒。他的設計是,平均每10分鐘兑凿,全網才能生成一個新區(qū)塊凯力,一小時也就六個眨业。
這種產出速度不是通過命令達成的,而是故意設置了海量的計算沮协。也就是說龄捡,只有通過極其大量的計算,才能得到當前區(qū)塊的有效哈希慷暂,從而把新區(qū)塊添加到區(qū)塊鏈聘殖。由于計算量太大,所以快不起來行瑞。
這個過程就叫做采礦(mining)奸腺,因為計算有效哈希的難度,好比在全世界的沙子里面血久,找到一粒符合條件的沙子突照。計算哈希的機器就叫做礦機,操作礦機的人就叫做礦工氧吐。
六讹蘑、難度系數
讀到這里,你可能會有一個疑問筑舅,人們都說采礦很難座慰,可是采礦不就是用計算機算出一個哈希嗎,這正是計算機的強項啊翠拣,怎么會變得很難版仔,遲遲算不出來呢?
原來不是任意一個哈希都可以误墓,只有滿足條件的哈希才會被區(qū)塊鏈接受蛮粮。這個條件特別苛刻,使得絕大部分哈希都不滿足要求谜慌,必須重算然想。
原來,區(qū)塊頭包含一個難度系數(difficulty)畦娄,這個值決定了計算哈希的難度又沾。舉例來說,第100000個區(qū)塊的難度系數是 14484.16236122熙卡。
區(qū)塊鏈協議規(guī)定杖刷,使用一個常量除以難度系數,可以得到目標值(target)驳癌。顯然滑燃,難度系數越大,目標值就越小颓鲜。
哈希的有效性跟目標值密切相關表窘,只有小于目標值的哈希才是有效的典予,否則哈希無效,必須重算乐严。由于目標值非常小瘤袖,哈希小于該值的機會極其渺茫,可能計算10億次昂验,才算中一次捂敌。這就是采礦如此之慢的根本原因。
前面說過既琴,當前區(qū)塊的哈希由區(qū)塊頭唯一決定占婉。如果要對同一個區(qū)塊反復計算哈希,就意味著甫恩,區(qū)塊頭必須不停地變化逆济,否則不可能算出不一樣的哈希。區(qū)塊頭里面所有的特征值都是固定的磺箕,為了讓區(qū)塊頭產生變化奖慌,中本聰故意增加了一個隨機項,叫做 Nonce滞磺。
Nonce 是一個隨機值升薯,礦工的作用其實就是猜出 Nonce 的值莱褒,使得區(qū)塊頭的哈匣骼В可以小于目標值,從而能夠寫入區(qū)塊鏈广凸。Nonce 是非常難猜的阅茶,目前只能通過窮舉法一個個試錯。根據協議谅海,Nonce 是一個32位的二進制值脸哀,即最大可以到21.47億。第 100000 個區(qū)塊的 Nonce 值是274148111
扭吁,可以理解成撞蜂,礦工從0開始,一直計算了 2.74 億次侥袜,才得到了一個有效的 Nonce 值蝌诡,使得算出的哈希能夠滿足條件。
運氣好的話枫吧,也許一會就找到了 Nonce浦旱。運氣不好的話,可能算完了21.47億次九杂,都沒有發(fā)現 Nonce颁湖,即當前區(qū)塊體不可能算出滿足條件的哈希宣蠕。這時,協議允許礦工改變區(qū)塊體甥捺,開始新的計算抢蚀。
七、難度系數的動態(tài)調節(jié)
正如上一節(jié)所說镰禾,采礦具有隨機性思币,沒法保證正好十分鐘產出一個區(qū)塊,有時一分鐘就算出來了羡微,有時幾個小時可能也沒結果谷饿。總體來看妈倔,隨著硬件設備的提升博投,以及礦機的數量增長,計算速度一定會越來越快盯蝴。
為了將產出速率恒定在十分鐘毅哗,中本聰還設計了難度系數的動態(tài)調節(jié)機制。他規(guī)定捧挺,難度系數每兩周(2016個區(qū)塊)調整一次虑绵。如果這兩周里面,區(qū)塊的平均生成速度是9分鐘闽烙,就意味著比法定速度快了10%翅睛,因此接下來的難度系數就要調高10%;如果平均生成速度是11分鐘黑竞,就意味著比法定速度慢了10%捕发,因此接下來的難度系數就要調低10%。
難度系數越調越高(目標值越來越泻芑辍)扎酷,導致了采礦越來越難。
八遏匆、區(qū)塊鏈的分叉
即使區(qū)塊鏈是可靠的法挨,現在還有一個問題沒有解決:如果兩個人同時向區(qū)塊鏈寫入數據,也就是說幅聘,同時有兩個區(qū)塊加入凡纳,因為它們都連著前一個區(qū)塊,就形成了分叉喊暖。這時應該采納哪一個區(qū)塊呢惫企?
現在的規(guī)則是,新節(jié)點總是采用最長的那條區(qū)塊鏈。如果區(qū)塊鏈有分叉狞尔,將看哪個分支在分叉點后面丛版,先達到6個新區(qū)塊(稱為"六次確認")。按照10分鐘一個區(qū)塊計算偏序,一小時就可以確認页畦。
由于新區(qū)塊的生成速度由計算能力決定,所以這條規(guī)則就是說研儒,擁有大多數計算能力的那條分支豫缨,就是正宗的區(qū)塊鏈。
九端朵、總結
區(qū)塊鏈作為無人管理的分布式數據庫好芭,從2009年開始已經運行了8年,沒有出現大的問題冲呢。這證明它是可行的舍败。
但是,為了保證數據的可靠性敬拓,區(qū)塊鏈也有自己的代價邻薯。一是效率,數據寫入區(qū)塊鏈乘凸,最少要等待十分鐘厕诡,所有節(jié)點都同步數據,則需要更多的時間营勤;二是能耗灵嫌,區(qū)塊的生成需要礦工進行無數無意義的計算,這是非常耗費能源的冀偶。
因此醒第,區(qū)塊鏈的適用場景,其實非常有限进鸠。
- 不存在所有成員都信任的管理當局
- 寫入的數據不要求實時使用
- 挖礦的收益能夠彌補本身的成本
如果無法滿足上述的條件,那么傳統的數據庫是更好的解決方案形病。
目前客年,區(qū)塊鏈最大的應用場景(可能也是唯一的應用場景),就是以比特幣為代表的加密貨幣漠吻。