不知從什么時候開始互亮,“大數(shù)據(jù)”這個詞悄然成為了我們的常用詞匯;我們余素,也不知從什么時候開始豹休,邁進(jìn)了“大數(shù)據(jù)時代”。那么溺森,大數(shù)據(jù)時代究竟是一個怎樣的時代慕爬?英國“大數(shù)據(jù)時代的預(yù)言家”維克托邁爾·舍恩伯格和肯尼思 庫克耶的《大數(shù)據(jù)時代》對此有著詳細(xì)而深刻的洞見。
一屏积、什么是大數(shù)據(jù)医窿?
根據(jù)《大數(shù)據(jù)時代》中所說,大數(shù)據(jù)并非一個確切的概念炊林,更多的是一種可能的方式姥卢。“大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的独榴。大數(shù)據(jù)是人們獲得新的認(rèn)知僧叉、創(chuàng)造新的價值的源泉,大數(shù)據(jù)還為改變市場棺榔、組織機(jī)構(gòu)以及政府與公民關(guān)系服務(wù)瓶堕。”症歇、“大數(shù)據(jù)即一種新型的能力:以一種前所未有的方式郎笆,通過對海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價值的產(chǎn)品和服務(wù)忘晤,或深刻的洞見宛蚓。”
讀罷此書设塔,本人更愿意認(rèn)為凄吏,大數(shù)據(jù)有兩層含義,第一層含義闰蛔,大數(shù)據(jù)是一個總結(jié)性的概念痕钢,是對海量數(shù)據(jù)的總稱;第二層含義即書本中所指出的钞护,是一種新型的能力與方式盖喷。
區(qū)別于小規(guī)模數(shù)據(jù)時代的抽樣分析,大數(shù)據(jù)時代难咕,分析的樣本不再需要經(jīng)過抽樣,直接將全體數(shù)據(jù)進(jìn)行更快更準(zhǔn)確地分析距辆。
二余佃、大數(shù)據(jù)的核心是什么?
書中指出跨算,預(yù)測爆土,是大數(shù)據(jù)的核心。根據(jù)收集到的數(shù)據(jù)分析诸蚕、挖掘出龐大數(shù)據(jù)庫獨(dú)有的價值(通過找出關(guān)聯(lián)物并監(jiān)控它步势,我們便可以預(yù)測未來),以便進(jìn)行干預(yù)或提供相應(yīng)的資源與服務(wù)背犯。
我覺得坏瘩,大數(shù)據(jù)的核心應(yīng)當(dāng)是減少冗余,提高資源配置效率漠魏。這里的效率包括兩個方面:資源配置的速度和配置的精確度(質(zhì)量)倔矾。
自古以來,人類社會的發(fā)展便是資源配置不斷優(yōu)化的過程,大數(shù)據(jù)作為一種新型的生產(chǎn)工具哪自,它能讓我們通過分析海量的數(shù)據(jù)丰包,得知該如何更有效地分配稀缺的資源。
如醫(yī)院通過對某個病人病史壤巷、生活習(xí)慣邑彪、衣食住行、工作娛樂情況等進(jìn)行全方位分析胧华,便可以準(zhǔn)確了解病人的生活情況與生活環(huán)境寄症,精確地指出癥結(jié)引起原因所在,只要建議病人針對引起病源的因素做出調(diào)整或進(jìn)行醫(yī)學(xué)干預(yù)撑柔,便可以了瘸爽,避免了對病人過多的用藥與過大范圍的盲目干預(yù)。
同樣的道理铅忿,如果銀行通過分析某一申請人的家庭情況剪决、消費(fèi)歷史、生活習(xí)慣檀训、財(cái)務(wù)習(xí)慣柑潦、網(wǎng)頁瀏覽記錄等各方面的數(shù)據(jù),便可以清晰了解此申請人各方面的情況峻凫,甚至可推測其內(nèi)心的真實(shí)想法與將要采取的做法渗鬼,從而判斷申請人的貸款申請資格,決定該不該授信荧琼,授信多少等內(nèi)容譬胎,所有的信息在大數(shù)據(jù)時代,能在系統(tǒng)中搜索一下命锄,幾分鐘便能全部收集完成堰乔。相比以前,申請人申請后脐恩,銀行得派出兩名客戶經(jīng)理上門進(jìn)行訪問镐侯、調(diào)查、收集電信驶冒、征信等多方面的信息(部分信息可能未必能收集到苟翻,或者未必收集到準(zhǔn)確的內(nèi)容),再進(jìn)行人工分析骗污、鑒別等過程崇猫,少說也得幾天吧?耗費(fèi)的時間多不說身堡,風(fēng)險(xiǎn)也相對更高:一是收集到的信息準(zhǔn)確度需要考究邓尤,二是收集到的只是部分信息,大量有關(guān)的其他可能是弱相關(guān)的信息,沒有收集汞扎,增加了信息噪音季稳,降低了結(jié)論的精確度,給銀行業(yè)務(wù)帶來風(fēng)險(xiǎn)澈魄。
可見景鼠,大數(shù)據(jù)的運(yùn)用不但提高了工作效率,節(jié)省了機(jī)構(gòu)與申請人的時間痹扇,更能基于精確的信息铛漓,確保風(fēng)險(xiǎn)可控,且保證了授信給該申請人的正確性鲫构,將有限的資金用在刀刃上浓恶,提高資源配置質(zhì)量。
三结笨、什么是大數(shù)據(jù)思維包晰?
書中指出,大數(shù)據(jù)思維是一種意識炕吸,認(rèn)為公開的數(shù)據(jù)一旦處理得當(dāng)就能為千百萬人急需解決的問題提供答案伐憾。
那意思,是不是說赫模,大數(shù)據(jù)思維便是相信數(shù)據(jù)分析的能力树肃、數(shù)據(jù)分析的結(jié)果以及預(yù)測的準(zhǔn)確性?這應(yīng)當(dāng)算一種信仰了瀑罗。
書中認(rèn)為胸嘴,大數(shù)據(jù)與三個重大的思維轉(zhuǎn)變有關(guān):首先,要分析與某事物相關(guān)的所有數(shù)據(jù)斩祭,而不再依靠分析少量的樣本筛谚;其次,樂于接受數(shù)據(jù)的紛繁復(fù)雜停忿,而不再追求精確度;最后蚊伞,我們的思維不再探求難以捉摸的因果關(guān)系席赂,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。
本人認(rèn)為时迫,大數(shù)據(jù)思維應(yīng)當(dāng)是一種意識颅停,認(rèn)識到大數(shù)據(jù)的無窮威力,并積極擁抱這個繁榮的時代掠拳;世界上的一切都是信息癞揉,都是可以量化分析的信息。如果將相關(guān)的信息進(jìn)行交互分析,便能獲得“上帝的視覺”——窺視知道分析對象的一切喊熟,包括所思所想柏肪;獲得的信息可以通過類比(其他有同樣行為舉止的人已經(jīng)干了什么),準(zhǔn)確推測分析對象的想法以及未來行為芥牌;根據(jù)推測出來的內(nèi)容進(jìn)行干預(yù)或服務(wù)烦味,從而獲得商業(yè)機(jī)會;在一切均有記憶壁拉、一切均能收集谬俄、能更加準(zhǔn)確預(yù)測未來的時代,我們或許受困于過去的行為(過去成為別人預(yù)測我們下一步工作的素材弃理,影響或好或壞溃论,一輩子無法消弭);在這個時代痘昌,對隱私權(quán)钥勋、公平與正義的探討上升至一個新的語境。
四控汉、我們都參與了眾包笔诵。
雖然大數(shù)據(jù)是近些年才提出來的說法,但事實(shí)上姑子,我們一直生活在數(shù)據(jù)海洋之中乎婿。只是在過去,我們從未意識到這些行為能被記錄街佑、被分析谢翎、從而成為生活中真實(shí)存在的永恒。如此時此刻點(diǎn)開的這篇文章沐旨,看著的這行字森逮,便成為您這輩子個人數(shù)據(jù)的內(nèi)容之一,永遠(yuǎn)存在磁携。
瀏覽網(wǎng)頁褒侧、看文章、逛街谊迄、買衣服闷供、打游戲、吃甜點(diǎn)……這些行為是我們今天才有的嗎统诺?不是的歪脏,我們生下來就開始漸漸接觸這一切,自然而然地發(fā)生著這些行為粮呢,只是婿失,在遙遠(yuǎn)的以前钞艇,由于技術(shù)尚未發(fā)達(dá),這曾經(jīng)發(fā)生的一切如海浪沖過的沙灘豪硅,留下了記憶便消失得無影無蹤哩照,但在現(xiàn)在,有了云計(jì)算舟误,有了更多的可以記錄信息的設(shè)備葡秒,我們每天自然而然地進(jìn)行著的這一切,才被記錄了下來嵌溢,變成了可分析的信息眯牧,變成了我們的過往;而我們赖草,也就自然而然地參與了大數(shù)據(jù)的“眾包”学少。(知乎用戶王喆定義:眾包指的是一個公司或機(jī)構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡(luò)的做法秧骑。)
因此版确,無論自覺還是被迫,無論愿意不愿意乎折,我們早就進(jìn)入了大數(shù)據(jù)時代绒疗,早就成為了數(shù)據(jù)提供和享用的神經(jīng)末梢。
不是么骂澄?
五吓蘑、新的時代,我們該怎么辦坟冲?
老子說磨镶,無為而治。因此健提,我們還是該吃飯就吃飯琳猫,該逛街就逛街,想吃甜點(diǎn)便吃甜點(diǎn)……該干嘛干嘛去私痹,過自己的生活脐嫂,努力自己的工作。大數(shù)據(jù)是一種意識紊遵,更是一種工具雹锣,所有的工具最終都是為了讓我們生活得更加方便、更加如意癞蚕,而作為最高智慧生物的我們,要做的辉哥,便是習(xí)學(xué)如何通過這新的工具桦山,改造世界攒射,創(chuàng)造生活。
當(dāng)然恒水,西方也有諺語:預(yù)測未來最好的辦法是創(chuàng)造未來会放。面對新的時代,我們钉凌,努力將生活過成自己想要的樣子(創(chuàng)造想要的未來)咧最,便是最好的信條。