一、數(shù)據(jù)化(一切皆可“量化”)
大數(shù)據(jù)發(fā)展的核心動力來源于人類測量焚鲜、記錄和分析世界的渴望。信息技術(shù)變革隨處可見放前,但是如今的信息技術(shù)變革重點在"T"上忿磅,而不是在“I”上。現(xiàn)在凭语,我們是時候把聚光燈投向“I”葱她,開始關(guān)注信息本身了。
馬修莫里曾是一名美國海軍軍官似扔,在一次意外中他大腿骨折吨些,從此無法繼續(xù)他的航海事業(yè)。幸運的是他在受傷后依舊被任命為圖表和儀器廠的負責(zé)人炒辉。在這里豪墅,莫里發(fā)現(xiàn),現(xiàn)在的航海圖大多都會選擇舍近求遠只因為走過這些路的許多水手都覺得這條航線安全辆脸。而依據(jù)莫里多年的航海經(jīng)驗但校,他知道這是完全錯誤的。他發(fā)現(xiàn)海軍依賴的圖表有的都使用了上百年啡氢,其中很大部分都有遺漏和離譜的錯誤状囱。當莫里有一天在整理倉庫時候發(fā)現(xiàn)了歷任海軍上尉的航海日志,他驚喜得發(fā)現(xiàn)倘是,他所需要的信息都在這日志里面亭枷。這本日志是許多上尉在無聊時候隨意填寫的,類似于日記本搀崭,里面甚至有許多無聊的涂鴉叨粘,但就是通過分析這些雜亂無章的信息猾编,莫里將其有價值的信息歸納整理,呈現(xiàn)出了一張全新的航海圖升敲。為了提高精準度答倡,莫里讓之后的海軍每次歸來必須將航海日志上交。他正是通過一次次的數(shù)據(jù)收集驴党,和計算處理瘪撇,最終繪制了一張直到今天還能夠使用的航海圖表。而且這張圖表幫助商人省下了一大筆錢港庄,因為航海路程因此減少了三分之一倔既。
龐大的數(shù)據(jù)庫有著小數(shù)據(jù)庫沒有的價值,莫里中校是最早發(fā)現(xiàn)這一點的人之一鹏氧。這說明遠在信息數(shù)字化之前渤涌,對數(shù)據(jù)的運用就已經(jīng)開始了。
數(shù)據(jù)化——是指一種把現(xiàn)象轉(zhuǎn)變?yōu)橹票矸治龅牧炕问降倪^程把还。
數(shù)字化——指的是把模擬數(shù)據(jù)轉(zhuǎn)化成用0和1來表示的二進制代碼实蓬。
因此,技術(shù)專家都默認大數(shù)據(jù)的發(fā)展和計算機的變革是同步的笨篷。
記錄信息的能力是原始社會和先進社會之間的分界線之一瞳秽。計量和記錄一起促成了數(shù)據(jù)的誕生,它們是數(shù)據(jù)化最早的根基率翅。幾百年來练俐,計量從長度和重量不斷擴展到面積、體積以及時間冕臭。大約公元1世紀的時候腺晾,印度發(fā)明了自己的一套數(shù)字系統(tǒng),并將其傳到波斯辜贵,而后傳入阿拉伯國家并獲得了極大的改進悯蝉。而這正是阿拉伯數(shù)字的前身。在12世紀托慨,介紹阿拉伯數(shù)據(jù)的書籍被翻譯成拉丁語鼻由,開始傳遍歐洲。
早在阿拉伯數(shù)字傳到歐洲之前厚棵,計數(shù)板的使用已經(jīng)改善了算術(shù)蕉世,但它勉強可以計算卻無法用來記錄。算術(shù)賦予了數(shù)據(jù)新的意義婆硬,因為它現(xiàn)在不但可以被記錄還可以被分析和再利用狠轻。伴隨著數(shù)據(jù)記錄的發(fā)展,人類探索世界的想法一直在膨脹彬犯,我們渴望能更精準地記錄時間向楼、距離查吊、地點、體積和重量湖蜕。到了19世紀逻卖,隨著新工具的發(fā)明測量,科學(xué)已經(jīng)開始離不開量化了昭抒。新工具和開放思維促進了測量事物和記錄數(shù)據(jù)的繁榮箭阶。數(shù)據(jù)化的基礎(chǔ)已經(jīng)奠定完好。計算機的出現(xiàn)帶來了數(shù)字測量和存儲設(shè)備戈鲁,這使得通過數(shù)學(xué)分析挖掘出數(shù)據(jù)更大的價值變成了可能。簡而言之嘹叫,數(shù)字化帶來了數(shù)據(jù)化婆殿,但是數(shù)字化無法取代數(shù)據(jù)化。
當文字變成數(shù)據(jù)罩扇,它就大顯神通了——人可以用之來閱讀婆芦,機器也可用之來分析。正如上一篇文章所說喂饥,谷歌通過掃描文本消约,將文字數(shù)字化,然后利用數(shù)據(jù)配對來選出最佳的翻譯語句员帮。而亞馬遜也同樣看到了這一領(lǐng)域或粮,它不僅將圖書轉(zhuǎn)化為數(shù)字圖像,還將數(shù)字圖像轉(zhuǎn)化為文本捞高,使人們可以在Kindle上更改字體大小和用黑白彩色兩種方式來看書氯材。而亞馬遜只是把重心放在閱讀本身,而谷歌卻觸及了數(shù)據(jù)化內(nèi)容的價值硝岗。
我們可曾想過氢哮,在最開始沒有東西南北,沒有經(jīng)緯度的時候型檀,我們是如何表達我們的地理位置的冗尤。古人云:“所謂伊人,在水一方胀溺×哑撸”這其實說明了,人和事物的地理定位自然是信息的組成部分月幌。
在1884年碍讯,在美國華盛頓召開的國際子午線會議上,24個國家一致同意定下本初子午線和零度經(jīng)線所穿過的地方扯躺。從此捉兴,地理定位信息終于能在標準化的數(shù)值范式下進行標記蝎困、記錄、測量倍啥、分析了禾乘。但是,早期的地理接收裝置非常昂貴虽缕,它適用于潛艇而不是出租車始藕。而隨著數(shù)字設(shè)備廉價芯片的普及和GPS的發(fā)展,使我們今天可以輕而易舉得知道我們此時此刻已經(jīng)想要知道的地方的坐標氮趋。
這樣的發(fā)展伍派,使得跟蹤事物的地理位置變得十分容易。隨著汽車裝上了無線傳感器剩胁,地理位置信息的數(shù)據(jù)化深刻變革了保險的概念诉植。車主會根據(jù)他的實際駕駛地點和時間購買汽車保險,這改變了保險的基礎(chǔ)昵观,從考慮一個群體的平均風(fēng)險轉(zhuǎn)變?yōu)閭€性化的分析晾腔。
但位置數(shù)據(jù)在商業(yè)以外的用途或許才是最重要的。麻省理工學(xué)院媒體實驗室人類動力學(xué)實驗室主任亞歷山大彭特蘭啊犬,通過分析手機數(shù)據(jù)來得知每個人去了哪里灼擂、見了誰,成功地區(qū)分除了感染了流感的人群觉至,而且這還是在感染者還不知道自己被感染的情況下剔应。
總之,位置信息一被數(shù)據(jù)化语御,新的用途就猶如雨后春筍般涌現(xiàn)出來领斥,而新價值也會隨之不斷催生。
數(shù)據(jù)化的另一個前沿更加人性化沃暗,直接觸摸到了我們的關(guān)系月洛、經(jīng)歷,情感孽锥。我們都知道嚼黔,在Facebook中有一項可能認識的人,這便是通過分析我們的位置惜辑,我們的社交網(wǎng)絡(luò)唬涧,甚至我們?nèi)粘V性S多意想不到的元素,從而得出每個屬于我們個人的“社交圖譜”盛撑。
數(shù)據(jù)化不僅能將態(tài)度和情緒轉(zhuǎn)變?yōu)橐环N可分析的形式碎节,也可能轉(zhuǎn)化人類的行為。就像賓夕法尼亞州立大學(xué)的一名生物學(xué)家那樣抵卫,他通過分析人群中twitter的狀態(tài)來得出他們的個人衛(wèi)生行為狮荔,從而更易發(fā)現(xiàn)未接種疫苗的人群在哪胎撇。
只要一點想象,萬千事物就能轉(zhuǎn)化為數(shù)據(jù)形式殖氏,并一直給我們帶來驚喜晚树。有了大數(shù)據(jù)的幫助,我們不會再將世界看作是一連串我們認為或是自然或是社會現(xiàn)象的事件雅采,我們會意識到本質(zhì)上世界是由信息構(gòu)成的爵憎。將世界看作信息,看作可以理解的數(shù)據(jù)的海洋婚瓜,為我們提供了一個從未有過的審視現(xiàn)實的視角宝鼓。它是一種可以滲透到所有生活領(lǐng)域的世界觀。
二巴刻、價值(“取之不盡席函,用之不竭”的數(shù)據(jù)創(chuàng)新)
數(shù)據(jù)就像一個神奇的鉆石礦,當它的首要價值被發(fā)掘后仍能不斷給予冈涧。它的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角正蛙,而絕大部分都隱藏在表面之下督弓。
事實上,數(shù)據(jù)通常都是為了某一個特定的目的而被收集的乒验,數(shù)據(jù)的基本用途為信息的收集和處理提供了依據(jù)愚隧。
不同于物質(zhì)性的東西,數(shù)據(jù)的價值不會隨著它的使用而減少锻全,而是可以不斷地被處理狂塘。就如同經(jīng)濟學(xué)家說的那般:個人的使用不會妨礙其他人使用,而且信息不會像其他物質(zhì)產(chǎn)品一樣隨著使用而有所耗損鳄厌。
數(shù)據(jù)的價值并不僅限于特定的用途荞胡,它可以為了同一目的而被多次使用,也可以用于其他目的了嚎。要了解大數(shù)據(jù)時代究竟有多少信息對我們有價值泪漂,后面這一點尤其重要。
要將所有數(shù)據(jù)價值的冰山融化歪泳,就必須通過新一代統(tǒng)計人員的不懈努力并借助新一代的方法和工具萝勤。最終,數(shù)據(jù)的價值是其所有可能用途的總和呐伞。這些選擇的總和就是數(shù)據(jù)的價值敌卓,即數(shù)據(jù)的“潛在價值”。
以下為六種數(shù)據(jù)創(chuàng)新:
①數(shù)據(jù)的再利用伶氢。益佰利旗下的公司Hitwise通過收集搜索流量數(shù)據(jù)來揭示消費者的喜好趟径,并可供政府部門制定下一步的政策瘪吏,也讓旅游公司通過了解人們的興趣點來對癥下藥。
②重組數(shù)據(jù)舵抹。丹麥癌癥協(xié)會記錄了大約358403名手機用戶和10729名中樞神經(jīng)系統(tǒng)腫瘤患者的信息肪虎。研究人員通過研究兩者間的關(guān)系,來探究手機是否會引發(fā)癌癥惧蛹。最后扇救,研究結(jié)論得出使用手機與癌癥之間不存在任何關(guān)系,但是這些數(shù)據(jù)的一開始收集也并不是為了這項課題香嗓,但卻仍然能被利用作為其他課題的樣本迅腔。隨著大數(shù)據(jù)的出現(xiàn),數(shù)據(jù)的總和比部分更有價值靠娱。
③可擴展數(shù)據(jù)沧烈。有些商店可以利用監(jiān)控攝像來知道顧客喜歡哪一類商品從而對其進行進購促銷,而在之前像云,監(jiān)控攝像僅僅只是作為監(jiān)控扒手小偷的工具锌雀,現(xiàn)在卻被視為一項可以增加收入的投資。
④數(shù)據(jù)的折舊值迅诬。即使數(shù)據(jù)用于基本用途的價值會減少腋逆,但潛在價值卻依然強大。
⑤數(shù)據(jù)廢氣侈贷。數(shù)據(jù)廢氣是許多電腦化服務(wù)背后的機制惩歉,如語音識別、垃圾郵箱過濾俏蛮、翻譯等撑蚌。當用戶指出語音識別程序誤解了他們的意思時候,他們實際上有效地“訓(xùn)練”了這個系統(tǒng)搏屑。
⑥開放數(shù)據(jù)争涌。由于政府在獲取數(shù)據(jù)中所處的特殊地位,他們在數(shù)據(jù)的使用上往往效率很低辣恋。因此第煮,“開放政府數(shù)據(jù)”擁有越來越多的支持者,他們希望政府可以公布民用和商業(yè)數(shù)據(jù)來幫助商業(yè)的進一步發(fā)展抑党。
公司賬面價值和市場價值之間的差額被記為“無形資產(chǎn)”包警。在大數(shù)據(jù)時代,數(shù)據(jù)成為這無形資產(chǎn)的主體部分底靠。也因為這是新時代下的產(chǎn)物害晦,導(dǎo)致傳統(tǒng)的審計方式無法用于這類資產(chǎn)的計算,造成了許多估值與計算價值之間的巨大差距。
那么壹瘟,我們應(yīng)該如何給數(shù)據(jù)估值鲫剿?
一個辦法是從數(shù)據(jù)持有人在價值提取上所采取的不同策略入手,最常見的一種可能性就是將數(shù)據(jù)授權(quán)給第三方稻轨。然而灵莲,由于被許可人可能無法提取數(shù)據(jù)全部的潛在價值,因此數(shù)據(jù)持有人可能還會向其他方授權(quán)使用數(shù)據(jù)殴俱,這將間接評測出數(shù)據(jù)的價值政冻。
三、角色定位(數(shù)據(jù)线欲、技術(shù)與思維的三足鼎立)
如今明场,我們正處于大數(shù)據(jù)時代的早期,思維和技術(shù)是最有價值的李丰,但是最終大部分的價值還是必須從數(shù)據(jù)本身中挖掘苦锨。
真正能使得公司取得成功得是他們擁有大數(shù)據(jù)的思維觀念。
大數(shù)據(jù)價值鏈的三大構(gòu)成:
一是基于數(shù)據(jù)本身的公司趴泌。這些公司把自己放在了這個信息鏈的核心舟舒,這樣它們就能擴大規(guī)模、挖掘數(shù)據(jù)的價值嗜憔。他們將通過數(shù)據(jù)來給予顧客更好的服務(wù)秃励,同時顧客也會因此還給他們更多的數(shù)據(jù),而他們在用完這些數(shù)據(jù)之后賣掉還可以再爭取一部分利潤痹筛。
二是基于技能的公司。這類公司通過受理分析數(shù)據(jù)擁有者授權(quán)給他的數(shù)據(jù)來進行分析并做出最完善的判斷廓鞠,他們經(jīng)常受到高度的贊揚帚稠,同時被封為“數(shù)據(jù)武士“這樣的時髦名字,但是他們在大數(shù)據(jù)中淘金床佳,發(fā)現(xiàn)了金銀珠寶卻要把這些財富拱手交回滋早。
三是基于思維的公司。這類公司大多是外行人砌们,因此他們的思維可以不受限制杆麸。他們思考的只有可能,而沒有可行浪感。
所謂大數(shù)據(jù)思維昔头,是指一種意識,認為公開的數(shù)據(jù)一旦處理得當就能為千百萬人急需解決的問題提供答案影兽。如今的大數(shù)據(jù)先驅(qū)者們通常都有著交叉學(xué)科的背景揭斧。大數(shù)據(jù)就可以變革公司的盈利模式和傳統(tǒng)交流模式。
全新的數(shù)據(jù)中間商峻堰。這應(yīng)該是那些擁有大數(shù)據(jù)思維或者說創(chuàng)新性思維的人讹开。如今我們正處于大數(shù)據(jù)時代的早期盅视,思維和技能是最有價值的,但是最終旦万,大部分的價值還是必須從數(shù)據(jù)本身挖掘闹击。
大數(shù)據(jù)公司的多樣性表明了數(shù)據(jù)價值的轉(zhuǎn)移,隨著數(shù)據(jù)價值轉(zhuǎn)移到數(shù)據(jù)擁有者手上成艘,傳統(tǒng)的商業(yè)模式也被顛覆了赏半。
如今,行業(yè)專家和技術(shù)專家的光芒都會因為統(tǒng)計學(xué)家和數(shù)據(jù)分析家的出現(xiàn)而變暗狰腌,因為后者不受舊觀念的影響除破,能夠聆聽數(shù)據(jù)發(fā)出的聲音。他們的判斷建立在相關(guān)關(guān)系的基礎(chǔ)上琼腔,沒有受到偏見和成見的影響瑰枫。
在新聞界,數(shù)據(jù)比有經(jīng)驗的記者更能揭示出哪些是符合大眾口味的新聞丹莲。這意味著光坝,與時俱進才是職業(yè)領(lǐng)域取得成功得必備技能,專業(yè)技能就像精確性一樣甥材,只適用于“小數(shù)據(jù)”時代盯另。作為外行人,他們不會被行業(yè)內(nèi)的爭論所限制洲赵,因為他們不會被自己所支持一方的觀點所影響而產(chǎn)生偏見鸳惯。數(shù)學(xué)和統(tǒng)計學(xué)知識,甚至是有少許編程和網(wǎng)絡(luò)科學(xué)的知識將會成為現(xiàn)代工廠的基礎(chǔ)叠萍。不只是專業(yè)技能的深度很重要芝发,大數(shù)據(jù)的廣度也變得很重要。
人們往往通過經(jīng)驗來判斷事物苛谷,如同奧登的名詩中所說:“知識退化成騷亂的主觀臆想辅鲸,那是太陽神經(jīng)叢的感情引起的營養(yǎng)不足「沟睿”
大數(shù)據(jù)將決定著企業(yè)的競爭力独悴。大公司和小公司都可能成為贏家,而大部分中等規(guī)模的公司锣尉,要么向兩端轉(zhuǎn)換刻炒,要么破產(chǎn)。因為這些中等公司自沧,沒有大公司挖掘數(shù)據(jù)的能力落蝙,也沒有小公司靈活的數(shù)據(jù)思維,他們在這場與時俱進的戰(zhàn)爭中,將難以獲勝筏勒。所以移迫,一旦一個公司掌握了大數(shù)據(jù),它不但有可能超過它的多少管行,還有可能遙遙領(lǐng)先厨埋。
但是,我們的認知和制度都還不習(xí)慣這樣一個數(shù)據(jù)充裕的時代捐顷。
Next.