前幾天和一個讀基因方向的研究生聊天,提起現在有些技術手段孔轴,通過我們的唾液便能查到你是屬于哪種體質剃法,易胖?易脫發(fā)路鹰?有較強的運動能力等等贷洲。這便是大數據上的應用,通過對比基因庫里面的多種基因來進行一些判定晋柱。
近幾年「大數據」這個詞頻繁被提起优构,尤其是網絡和計算機能力的大幅提升,使得我們可以在每天產生的數以千億計的數據中抽離出對我們有價值的數據樣本雁竞,進而我們可以將注意力放在相關關系的發(fā)現和使用上俩块,通過趨勢分析現在預測未來,對人類的價值體系浓领、知識體系和生活方式產生深遠影響玉凯。
在日常生活中,若要找出相關關系联贩,我們可用數學方法漫仆,但如果是因果關系的話,就會陷入各種假設之中泪幌,數據就顯得不那么可行盲厌。所以,我們沒必要一定要找出相關關系背后的原因祸泪,當我們知道“是什么”的時候吗浩,“為什么”其實沒那么重要。
在大多數情況下没隘,一旦我們完成了對大數據的相關關系分析懂扼,而又不再滿足于僅僅知道“是什么”時,我們就會繼續(xù)向更深層次研究因果關系,找出背后的“為什么”阀湿。
社交關系在過去一直被視作信息而存在赶熟,但從未被正式定為數據,直到Facebook“社交圖譜”的出現陷嘴,讓人們能輕易記錄以及分享他們零散的想法映砖,從而使情緒數據化得以實現,把信息轉化為對現在和將來的預測:我們很可能認識誰灾挨?或者你比大多數人更勝任哪一份工作邑退?然后精準進行推送。
數據化代表人類認識的一個根本性轉變劳澄,有了大數據的幫助瓜饥,我們不會再將世界看作是一連串我們認為或是自然或是社會現象的事件,我們會意識到本質上世界是由信息構成的浴骂。數據的基本用途為信息的收集和處理提供了依據,不同于物質性的東西宪潮,數據的價值不會隨著它的使用而減少溯警,而是可以不斷地被處理。這是經濟學家所謂“非競爭性”的好處:個人的使用不會妨礙其他人的使用狡相,而且信息不會像其他物質產品一樣隨著使用而有所損耗梯轻。
數據化是一種把現象轉變?yōu)榭芍票矸治龅牧炕问降倪^程。具體應用在文本尽棕、方位喳挑、溝通以及現象等方面的轉化。文本方面的應用有電子書的翻譯服務滔悉,方位的數據化則體現在地理范圍的gps定位服務通過對溝通中關系數據的記錄伊诵、發(fā)現、預測人們行為回官,以實現我們期待的不期而遇曹宴,另外通過對現象的個性化總結、排序歉提,形成對應的個性化推薦笛坦。
數據化的價值在于創(chuàng)新、具體有再利用苔巨、重整版扩、可擴展。盡管在數據使用過程中會有折舊侄泽,但其潛在價值依然重大礁芦。數據使用過程中不可避免會產生數據廢氣,也會帶來更多的威脅悼尾,畢竟大數據的核心思想就是用規(guī)模劇增來改變現狀宴偿。對于危害湘捎,不再過多闡述,在日常工作中大數據的用途則要善于搜集窄刘、整理窥妇、集中置于可制表分析的形式中,用數據和現象對我們的工作作出更相關精準的分析娩践。