書中內(nèi)容的概要總結(jié)
《萬(wàn)物皆無(wú)序:新數(shù)字秩序的革命》一書葛账,在前言“空間中的信息”中婚惫,以史泰博“超市原型實(shí)驗(yàn)室”為例椿胯,講述了在實(shí)體空間中信息的限制筷登。在任一時(shí)刻,實(shí)體物件只能存在于一個(gè)地點(diǎn)哩盲,因此即便是人們有不同的需求前方,在超市中商品的布局只能有一個(gè)。不同的用戶面對(duì)同樣的商品布局廉油,他們各自需求不同镣丑,無(wú)論實(shí)驗(yàn)室將布局設(shè)計(jì)得多么出色,都只能方便其中一部分用戶娱两。但是在由數(shù)位構(gòu)成的數(shù)字世界中莺匠,這一切截然不同,商品不再有序十兢,它們“亂”成一團(tuán)。通過(guò)計(jì)算機(jī)的處理能力和儲(chǔ)存在計(jì)算機(jī)中商品的元數(shù)據(jù)描述冷蚂,用戶可以按自己的方式整理商品粱侣,不再局限于單一布局。
這本書中卫袒,將對(duì)事物整理的秩序劃分為三階。
- 一階秩序
在秩序的一階當(dāng)中单匣,我們整理的是事物本身夕凝。例如我們將書放進(jìn)書架、將照片放進(jìn)相冊(cè)里面户秤。也就是整理真實(shí)世界中的物體码秉。 - 二階秩序
在秩序的二階當(dāng)中,我們整理的是事物的元數(shù)據(jù)——有關(guān)一階物體的信息鸡号。但是二階當(dāng)中有天然的限制转砖,并非所有與一階物體相關(guān)的信息都被記錄下來(lái)。 - 三階秩序
物體的內(nèi)容被數(shù)碼化鲸伴,變成了數(shù)位府蔗;該內(nèi)容的相關(guān)信息(元數(shù)據(jù))也被數(shù)碼化,變成數(shù)位汞窗。數(shù)位化帶來(lái)的好處顯而易見(jiàn):它突破了實(shí)體世界的界限姓赤,對(duì)物體的描述信息可以多于物體本身的信息。
在溫伯格寫這本書的時(shí)候仲吏,三階秩序帶來(lái)的好處才開(kāi)始體現(xiàn)不铆,傳統(tǒng)的按一階、二階秩序?qū)κ挛镞M(jìn)行整理的方式占據(jù)主流蜘矢。所以狂男,溫伯格在這本書中,主要從以下的對(duì)比品腹,分析和總結(jié)了三階秩序帶來(lái)的影響岖食。
- 維基百科與《大英百科全書》的內(nèi)容來(lái)源
- 亞馬遜和圖書館對(duì)于書籍的不同分類方式
- Flickr.com和傳統(tǒng)相冊(cè)關(guān)于照片的整理方式
- Delicious.com和普通的書簽的區(qū)別
信息組織的任務(wù)與挑戰(zhàn)
書中提到三階秩序帶來(lái)的改變,我們現(xiàn)在已經(jīng)習(xí)以為常舞吭。按用戶需求對(duì)內(nèi)容排序泡垃,按用戶自定義標(biāo)簽組織內(nèi)容,分面式分類系統(tǒng)以及對(duì)隱式信息的挖掘與利用羡鸥,這些技術(shù)在現(xiàn)在數(shù)字世界中隨處可見(jiàn)蔑穴。而且正如溫伯格所描述的一般,三階的混亂越來(lái)越龐大惧浴。人們基于數(shù)字世界進(jìn)行內(nèi)容創(chuàng)作存和,事物被數(shù)字化,電子設(shè)備和軟件記錄著人們的日常活動(dòng)……這些行為成為了現(xiàn)如今的常態(tài)捐腿,產(chǎn)生了大量的信息纵朋。如何從這一堆混亂的、增長(zhǎng)速度日益加快的信息中找到有用的信息茄袖,或者從中挖掘出價(jià)值操软,成為當(dāng)前ICT環(huán)境下信息組織的任務(wù)與挑戰(zhàn)。
信息組織的前提:元數(shù)據(jù)
談及對(duì)信息的利用宪祥,首先我們要做的事情是將無(wú)序聂薪、混亂的信息按某種方式進(jìn)行組織。溫伯格所說(shuō)的無(wú)序混亂的數(shù)位信息擁有比一階蝗羊、二階秩序更多價(jià)值有一個(gè)很重要的前提藏澳,信息能通過(guò)自身的元數(shù)據(jù)(信息的信息)互相聯(lián)系起來(lái)。
對(duì)于一幅圖片肘交,能直接與圖片二進(jìn)制編碼相關(guān)聯(lián)的圖片極少笆载;但通過(guò)圖片的元數(shù)據(jù)扑馁,若干的圖片能以不同維度聯(lián)系起來(lái)涯呻。我們從后者的關(guān)聯(lián)能挖掘出比前者更多的價(jià)值。關(guān)于圖片的元數(shù)據(jù)越多腻要,我們就能從更多維度來(lái)組織圖片复罐。沒(méi)有元數(shù)據(jù),數(shù)量龐大的圖片在數(shù)字世界中就是真正的“無(wú)序與混亂”雄家,每一張都是孤立的個(gè)體效诅,我們無(wú)法利用計(jì)算機(jī)將圖片有效組織起來(lái),從圖片之間的聯(lián)系中挖掘出價(jià)值趟济。
溫伯格在書中提出了“包括與推遲”的概念:包括所有能找到的信息乱投,推遲分類與組織。我認(rèn)為這里指的信息顷编,指的就是事物的元數(shù)據(jù)戚炫。包括事物盡可能多的元數(shù)據(jù),數(shù)字世界總能以一種方式去利用這些數(shù)據(jù)媳纬。
信息如何組織
信息組織的關(guān)鍵是對(duì)信息進(jìn)行分類双肤。
溫伯格用了大量篇幅去描述前兩階秩序與三階秩序之前不同的信息分類方式。傳統(tǒng)的樹狀圖式的分類方式钮惠,在數(shù)字世界中有著許多局限性茅糜。事物的分類并不是非此即彼,事物可以按照不同的分類標(biāo)準(zhǔn)素挽、不同的組織順序進(jìn)行組織蔑赘。
數(shù)字世界中大量的無(wú)序混亂的信息在元數(shù)據(jù)的作用下并非真正的無(wú)序。計(jì)算機(jī)利用信息的元數(shù)據(jù)對(duì)信息分類。在參照標(biāo)準(zhǔn)的前提下缩赛,從系統(tǒng)用戶的需求出發(fā)锌历,對(duì)信息的元數(shù)據(jù)盡可能詳細(xì)地刻畫,我們就能給用戶提供更多的檢索峦筒、排序與篩選信息的方式究西。
隱式信息與隱私泄露
溫伯格書中描述的一個(gè)重要概念是隱式信息。隱式信息是對(duì)可見(jiàn)信息本身或者對(duì)可見(jiàn)信息之前關(guān)系進(jìn)行推理后得到的信息物喷。數(shù)字世界無(wú)法對(duì)可見(jiàn)信息本身進(jìn)行推理卤材,但是當(dāng)信息之間有了聯(lián)系,通過(guò)設(shè)計(jì)好的算法峦失,計(jì)算機(jī)能從關(guān)鍵的顯示信息中得到隱式信息扇丛。
這些挖掘出來(lái)的隱式信息,讓企業(yè)對(duì)消費(fèi)者了解得更加深入尉辑。企業(yè)可以根據(jù)隱式信息對(duì)消費(fèi)者提供針對(duì)性的服務(wù)帆精,提高用戶體驗(yàn)的同時(shí),擴(kuò)大企業(yè)的盈利隧魄。
挖掘隱式信息是現(xiàn)在信息組織過(guò)程中卓练,必須要做的一件事情。不進(jìn)行挖掘购啄,就無(wú)法對(duì)消費(fèi)者提供針對(duì)性的服務(wù)襟企,企業(yè)就會(huì)喪失在同類互聯(lián)網(wǎng)行業(yè)中的競(jìng)爭(zhēng)力。
但是這個(gè)技術(shù)帶來(lái)了一個(gè)很嚴(yán)重的狮含,容易被忽視的問(wèn)題顽悼,那就是人們的隱私安全。數(shù)據(jù)挖掘需要收集用戶的大量信息几迄。也許直觀看上去蔚龙,每一條信息都不能算是用戶隱私,但是當(dāng)信息積累到一定數(shù)量映胁,通過(guò)挖掘木羹,用戶的興趣愛(ài)好、性格在企業(yè)面前變得完全透明屿愚,企業(yè)成為了消費(fèi)者的“知己”汇跨,了解消費(fèi)者勝過(guò)用戶自己。消費(fèi)者對(duì)這一切可能并不知情妆距,不免讓人細(xì)思恐極穷遂。
前些天Facebook的用戶數(shù)據(jù)泄露事件為我們敲響了警鐘,人們對(duì)自己的數(shù)據(jù)隱私看得越來(lái)越重要娱据。在信息組織的過(guò)程中蚪黑,我們必須要對(duì)數(shù)據(jù)進(jìn)行挖掘盅惜,以生產(chǎn)出更多的價(jià)值(提升用戶體驗(yàn)帶來(lái)的價(jià)值,而不是販賣挖掘出來(lái)的用戶數(shù)據(jù))忌穿。我們必須對(duì)用戶的隱私心生敬畏抒寂。