我手機上常用的是某C瀏覽器硬霍。平時用它看網(wǎng)頁帜慢、看文章、購物什么唯卖,大部分的應(yīng)用都是用它了粱玲。看網(wǎng)頁時拜轨,偶爾頁面下面會跳出一些廣告抽减,一般是跳出來就關(guān)了也沒注意。有陣子我寫論文橄碾,經(jīng)常用手機查相關(guān)的一些書和文章卵沉。某一天突然發(fā)現(xiàn),瀏覽器下面跳出來的頁面廣告法牲,都和我最近看的那些資料有關(guān)系史汗。如果廣告吃的或者穿的,那也不奇怪拒垃。但哪個商家無聊會發(fā)關(guān)于論文的比較偏門的超級小眾的廣告啊停撞。于是,我明白了,我被大數(shù)據(jù)了戈毒。
網(wǎng)絡(luò)上每天產(chǎn)生巨量的數(shù)據(jù)艰猬,這些數(shù)據(jù)有多巨量呢?2013年左右統(tǒng)計的數(shù)據(jù)是:一天之中埋市,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.7億張DVD冠桃,收發(fā)的電子郵件有近3000億封(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的論壇帖子達200萬條(相當(dāng)于《時代》雜志770年的文字量)道宅。并且數(shù)據(jù)量每年以40%左右的速度遞增腊满。2013年后的三年,也就是2016年培己,數(shù)據(jù)量應(yīng)該又增加了2,7倍。麥肯錫全球研究所給出的定義是:大數(shù)據(jù)是一種規(guī)模大到在獲取胚泌、存儲省咨、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集玷室,具有海量的數(shù)據(jù)規(guī)模零蓉、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征穷缤。
如此巨量的數(shù)據(jù)敌蜂,埋藏著豐富的信息。如果你要裝修津肛,你會常在網(wǎng)絡(luò)上瀏覽關(guān)于裝修的帖子章喉,并搜索相關(guān)的關(guān)鍵字。如果家里有孩子身坐,你會關(guān)注幼兒論壇秸脱,會參與論壇互動,會在購物網(wǎng)站上購買兒童用品部蛇。不同年齡的人會喜歡不同的歌手摊唇,會搜不同的歌。不同工作領(lǐng)域的人涯鲁,會在網(wǎng)上關(guān)注不同的話題巷查。這些個人傳播的數(shù)據(jù)都帶有明顯的個人特征。你使用的數(shù)據(jù)會透露出抹腿,你的家庭狀況是夠富有岛请,你有沒有車,你住在哪里等等幢踏。這些信息流會帶著你個人的印記髓需,在網(wǎng)絡(luò)上傳播。根據(jù)你的長期的訪問數(shù)據(jù)和傳播數(shù)據(jù)房蝉,分析專家可以為你畫一幅個人數(shù)據(jù)畫像:男僚匆,40歲左右微渠,去年買房,車是別克英朗XT的咧擂,住在湖邊小區(qū)逞盆,畢業(yè)于清華大學(xué)中文系,在海濱區(qū)BCD大樓工作松申,從事IT工作云芦,孩子四歲......而我的某C瀏覽器,應(yīng)該就是記錄了我最近的瀏覽關(guān)鍵字贸桶,主動向我推送我關(guān)心的資料舅逸。大數(shù)據(jù)泄露了我們個人的不少隱私。我們都被“大數(shù)據(jù)”了皇筛。
但另一方面琉历,大數(shù)據(jù)也幫助我們解決了許多問題。例如水醋,2008年谷歌推出了流感預(yù)測功能旗笔。因為在生病流感的時候,很多人會在谷歌搜索一些特定的詞匯關(guān)鍵字拄踪,查找一些特定的資料蝇恶。當(dāng)這些信息在某些地區(qū)出現(xiàn)的頻度突然增加時,就表示有流感爆發(fā)的可能性惶桐。谷歌根據(jù)這些信息撮弧,通過一定算法處理數(shù)據(jù)并推出了流感預(yù)測功能。在2009年姚糊,谷歌工程師發(fā)布了論文想虎,確認(rèn)谷歌流感預(yù)測功能極為成功,流感爆發(fā)區(qū)域可以具體到特定的小地區(qū)叛拷,并且比醫(yī)療部門的統(tǒng)計數(shù)據(jù)更及時舌厨。對大數(shù)據(jù)中信息的挖掘作用非常大,可以幫助企業(yè)了解客戶的需求實現(xiàn)精準(zhǔn)營銷忿薇;優(yōu)化生產(chǎn)和營銷流程從而降低全社會的成本裙椭;改善我們的生活(例如剛才說的流感統(tǒng)計幫助醫(yī)生防治疾病,或者實時路況幫助我們出行)署浩;改善社會安全(監(jiān)測犯罪和恐怖主義的行為揉燃,曝光犯罪行為)等等。
大數(shù)據(jù)是一把雙刃劍筋栋,但這是一個時代的問題炊汤。我們不再通過空氣用說話來傳遞消息,不再通過筆和紙聯(lián)系。我們通過電信號抢腐,通過0和1的電平來獲取和發(fā)出信息姑曙。這些信息必須被儲存后,才能被接受和發(fā)送迈倍。網(wǎng)絡(luò)需要被管理伤靠,我們的信息按照預(yù)先設(shè)定的線路被儲存,傳送啼染,儲存宴合,傳送。并且我們在日常生活中越來越離不開網(wǎng)絡(luò)了迹鹅。我們快速得獲得大量的信息的同時卦洽,也留下了大量的痕跡。
凡走過斜棚,必留下痕跡逐样,凡獲得,必付出代價打肝。大數(shù)據(jù)前所未有的運算能力帶給了我們不可思議的發(fā)現(xiàn)、創(chuàng)新挪捕,并推動著我們生活質(zhì)量的進步粗梭。但這種能力也給我們的法律、倫理及社會規(guī)范發(fā)起了挑戰(zhàn)级零。如同核能断医,大數(shù)據(jù)也是科技成果之一,一樣都可能成為雙刃劍奏纪。如何使用鉴嗤,在于人類的智慧。