上一篇:基于互聯(lián)的大數(shù)據 之二——需要深入理解大數(shù)據
?最初,我們接觸的是分隔的耕突,離散的笤成,有限的數(shù)據,要測量土地的面積眷茁,運作帝國的稅收體系炕泳,我們發(fā)展了數(shù)值計算的方法,依靠籌碼上祈、算盤培遵、紙筆等完成任務浙芙。
第二個階段隨著現(xiàn)代化而不斷開啟,世界變得復雜籽腕,結構化的數(shù)據應用得以產生嗡呼,并不斷發(fā)展壯大。所謂結構化數(shù)據皇耗,是定義某個研究目標的特性晤锥,形成列,然后采集不同的個體廊宪,形成行矾瘾,行和列就形成了矩陣的結構,可以有效地展開各種工作箭启。迄今為止壕翩,我們還享受著這一先進信息化體系帶來的好處,全球聯(lián)網的股票交易系統(tǒng)傅寡、現(xiàn)代化的大生產體系放妈,都得益于這強勁而有效的數(shù)據處理系統(tǒng)。
第三個階段正在開啟荐操,我們正在擁有海量的芜抒、多類別的數(shù)據,要求我們改進認識托启,發(fā)展新的數(shù)據分析體系宅倒。
數(shù)值計算是人類在科技能力低下時代的選擇,結構化數(shù)據是大的進步屯耸,其實并沒有多么超越過去拐迁。它要從我出發(fā),為世界設計一個框架疗绣,厘清對象的關系线召,以獲得問題的求解。無論世界多么復雜多矮,它都要抽取某些特征來研究缓淹,只關注最關鍵的點位;不管世界的變遷塔逃,它要維持一個穩(wěn)定的體系讯壶。
正如醫(yī)學上,不管個性化的生命患雏,抽取一些顯著特征鹏溯,展開標準化的研究;不管豐富的內外影響淹仑,用有限的關系去應對丙挽;不管生命如何變化肺孵,不管醫(yī)學需求如何改變,它都要維持一個靜態(tài)的模型颜阐。
人類要進步平窘,醫(yī)學要發(fā)展,就應當脫離過去的溫柔約束凳怨,打破結構化數(shù)據的框架瑰艘,進化到大數(shù)據模式。它有開放的基因肤舞,基于互聯(lián)網運作紫新,一切力量都可加入進來,所有需要計算的都可以納入李剖,任何需求都可以滿足芒率。
以前的結構化數(shù)據庫采用了集中的方法,以高效地提供運算需要的數(shù)據篙顺,比如把億萬人的身高存到數(shù)據庫中偶芍,以快速計算平均值。現(xiàn)在我們進步了很多德玫,不使用這種數(shù)據存儲也是可以的匪蟀,可存儲為文件系統(tǒng)中的一個個節(jié)點,寄存于世界的每個傳感器中宰僧,放置到每個人的手機中材彪,根據需要和權限,檢索了集中到一起進行運算撒桨。
只要我們根據某種規(guī)則查刻,能從某個端口獲得數(shù)據,并且能滿足一定的響應速度就可以凤类,不管這個數(shù)據是如何來的,不管它是傳統(tǒng)數(shù)據庫的記錄普气,還是傳感器的測量值谜疤,還是X光片的識別結果。
數(shù)據存放在世界各處现诀,根據需求取用夷磕,這是互聯(lián)時代唯一可行的方案,以往的方案中仔沿,數(shù)據要運轉到某個集中的地方坐桩,規(guī)范化地組織,顯然無法應對海量的數(shù)據封锉。
一切可能影響生命和疾病的因素都可參與進來绵跷,只要它能獲得人們的認可膘螟,只要我們發(fā)展了相應的測量方法。
世上一切可以計算的單元都可參與進來(比如調用每個空閑的運算單元)碾局,只要它能正確地根據動態(tài)邏輯輸出運算結果荆残。
世界上一切能思考的存在都可參與進來(包括人工智能),鼓勵民眾根據他們的理解組織數(shù)據運算净当,集結民眾智慧來探索真知内斯。這是對科學的擴展,理解世界的主角就從科學時代的少數(shù)人擴展到全體民眾像啼。
這是要打造平臺俘闯,以引入所有的智慧因素,鮮明區(qū)別于以往身先士卒的科學思路忽冻。這是當下的生產力水平下真朗,人類可能做到的最好。
結構化數(shù)據要求權威的團隊定義一切甚颂,不允許其他人修改調整蜜猾;大數(shù)據體系不一樣,允許每個人添加新的項目振诬,定義各項目之間的關系蹭睡,定義哪些項目需要整合了體現(xiàn)新特性。我們可提供圖形化的界面赶么,便于每個人理解和操縱各種數(shù)據項目肩豁。只要這種改進得到別人的認可原押,就可流傳開去匆光。
結構化數(shù)據體系在強化中心碱璃,存在一個數(shù)據中心饺蚊,所有數(shù)據都匯總到中心跪削,并從中心發(fā)出拜英,哪怕數(shù)據可以映射到各地咧栗,也是要維護中心的威嚴蒂誉,不許可人們自由行事〔勒欤現(xiàn)在篡悟,這種中心消解了,數(shù)據之間的交互是人們自由發(fā)起的匾寝,涉及的數(shù)據范圍由人們自由定義搬葬,觸發(fā)條件也是個性化的。
結構化數(shù)據要求專業(yè)人員的思考艳悔,體現(xiàn)了科學的價值觀和方法論急凰,大數(shù)據方法要體現(xiàn)每個人的思維,它要復制人理解世界的模式猜年,通過對世界的真實模擬來幫助思考抡锈,比如疾忍,列出最近一段時間的舌苔變化,同步顯示所有影響舌苔的因素企孩,以啟發(fā)人的洞察力锭碳。
隨著大數(shù)據的發(fā)展,科技就從以自我為中心轉向以對象為中心勿璃。這種體系用于醫(yī)學擒抛,能真正以生命為中心,看到生命的流淌补疑,感知到每一次內外刺激歧沪,體會生老病死,真正走入人的世界莲组,感知喜怒哀樂诊胞,協(xié)同每個人展開。
從數(shù)值化的計算锹杈,到傳統(tǒng)的統(tǒng)計分析撵孤,到大數(shù)據;從孤立的數(shù)據竭望,到結構化數(shù)據邪码,到非結構化數(shù)據,已經昭示了科學的發(fā)展軌跡咬清。
計算是人的本能闭专,一切工具都是這個本能的擴展,籌碼和算盤就是明顯例子旧烧,古時候能力有限影钉,只能應對關鍵需求,比如人口掘剪、田畝平委、兵力。計算機是大的進步夺谁,它極大地擴展了數(shù)據量和運算速度肆汹,完全超越人類,但它被征用來運算結構化數(shù)據予权,這是統(tǒng)治時代的思維,凸顯少數(shù)人的重要性浪册,只能應對少數(shù)重要特征扫腺,如此做出關于人類命運的決定。
回過頭去理解當下的關于大數(shù)據的定義村象,就能明白笆环,它們幾乎都是思維古板的科學時代的人們從自身角度出發(fā)的見解攒至,比如能容納海量數(shù)據,高并發(fā)低延時躁劣。這是發(fā)自技術思維的迫吐,一些庸俗化的認識,試圖把世界框進過去的模式账忘,根本沒有觸及互聯(lián)的精髓志膀,不理解人類的未來,也就低效于人類迫切需要解決的問題鳖擒。
在生機勃勃的互聯(lián)時代溉浙,大數(shù)據會快速進化。它很可能是正確的方向蒋荚,它是我們所能達到的最新認識戳稽,重大進展還沒有取得,那是因為我們的認識還不夠深入期升。
當數(shù)據獲得方法惊奇、存儲方式、處理思路播赁、和如何解讀結論等多個環(huán)節(jié)都有長足進展后颂郎,大數(shù)據將發(fā)揮其真正價值,推進人類發(fā)展行拢。