首先凿歼,問大家?guī)讉€(gè)問題呀癣。一個(gè)人的成名是偶然的嗎划鸽?歷史上哪些作家被納粹審查得最徹底男娄?The United States是從什么時(shí)候從復(fù)數(shù)名詞變成單數(shù)名詞的?如果我們想了解現(xiàn)代人類社會(huì)漾稀,你會(huì)去哪里尋求有力的幫助呢?是頂級(jí)的圖書館建瘫,一流的大學(xué)崭捍,還是我們每天都在用的在線社交平臺(tái)呢?人類歷史的演變和未來趨勢可以被數(shù)字量化嗎啰脚?
今天和大家分享一本我最近正在讀的書——《可視化未來:數(shù)據(jù)透視下的人文大趨勢》殷蛇。這本書之所以吸引我实夹,首先是因?yàn)槲覐氖碌氖侨宋膶W(xué)科的工作,數(shù)字看似離我很遙遠(yuǎn)粒梦,但在這樣一個(gè)用大數(shù)據(jù)說話的社會(huì)背景下亮航,人文學(xué)科的工作者如何才能緊跟趨勢、把大數(shù)據(jù)為己所用匀们,是我最近比較關(guān)注的話題缴淋;其次,我們每天都在談?wù)摯髷?shù)據(jù)泄朴,那么大數(shù)據(jù)到底如何影響我們的生活重抖,它可以為我們帶來哪些啟示和應(yīng)用的趨勢,也是值得我們思考的一個(gè)問題祖灰。簡單來說钟沛,這本書的作者利用Google Books掃描的3000萬本書籍做了一個(gè)叫做NGram viewer(N元詞組詞頻查看器)的工具,通過統(tǒng)計(jì)圖書中文字的詞頻局扶,揭示了英語如何演變恨统、詞典如何犯錯(cuò)、人們?nèi)绾纬擅琛⒄绾螇褐扑枷胄舐瘛⒓w如何記憶和遺忘,以及文化如何以一種確定性方式運(yùn)轉(zhuǎn)等問題沈跨,并且探討了如何預(yù)測人類未來的可能性由捎。
這本書的內(nèi)容可能離大家比較遠(yuǎn),感興趣的同學(xué)可以看一下饿凛,因?yàn)檫@本書舉了很多有意思的例子狞玛,可以幫助我們從不同的視角來看待一些普遍問題。但今天我主要想和大家分享一下這本書帶給我的三點(diǎn)啟示:
1. 轉(zhuǎn)變視角涧窒,改變方式心肪,世界大不同。大數(shù)據(jù)給我們提供了一個(gè)全新的看待世界的方式纠吴,通過這種數(shù)據(jù)視角硬鞍,我們能夠研究很多有意思的話題。比如戴已,回到我前面的一個(gè)問題固该,一個(gè)人的成名是偶然的嗎?名望其實(shí)是一個(gè)很難界定的詞語糖儡。這本書中的大數(shù)據(jù)分析(即書中每100萬個(gè)詞中的出現(xiàn)頻次)發(fā)現(xiàn)伐坏,名望的發(fā)展是有整體規(guī)律的,包括四個(gè)階段:嶄露頭角握联、指數(shù)級(jí)上升桦沉、到達(dá)名望頂峰每瞒、緩慢衰減,但不同時(shí)代的人名望發(fā)展稍有區(qū)別:隨著時(shí)間的推移纯露,人們嶄露頭角的年齡逐漸變小剿骨,上升的速度在加快,衰減的速度也在加快埠褪,唯一沒有太大變化的是到達(dá)名望頂峰的年齡一般在75歲左右浓利。作者還研究了5類職業(yè):演員、作家组橄、政治家荞膘、科學(xué)家和藝術(shù)家的成名軌跡,為年輕人的職業(yè)選擇提供了一些參考數(shù)據(jù):
∮窆ぁ(1)演員一般會(huì)在30歲左右成名羽资,擁有一輩子時(shí)間享受自己的名氣;
∽癜唷(2)作家一般在接近40歲成名屠升,但撰寫傳世佳作的頂級(jí)作家最終獲得的名望要比演員高得多;
∠林!(3)政治家一般在40歲之后腹暖、50歲之后甚至60歲之后才達(dá)到他們名望的頂峰;
『踩(4)科學(xué)家一般在60多歲成名脏答,獲得的名望和演員差不多;
∧豆怼(5)藝術(shù)家和科學(xué)家等待的時(shí)間一樣長殖告,獲得的名望卻只有其一半。
當(dāng)然雳锋,這些數(shù)據(jù)有其時(shí)代性和研究范圍的局限性黄绩,但為我們提供了一個(gè)用數(shù)字研究社會(huì)問題的新視角和新方向。方向大于方法玷过,無論是一個(gè)好的研究還是好的提案爽丹,都需要問出好問題,然后用合適的方法辛蚊,得出一個(gè)有效的結(jié)論粤蝎。
2. 記錄,可知過去袋马,可見未來诽里。易效能人喜歡說的一句話是,沒有記錄就沒有發(fā)生飞蛹。我們現(xiàn)在每天寫的晨間日記谤狡、日反思、周檢視卧檐、月度檢視墓懂、年度檢視不僅僅是記錄過去發(fā)生了什么,也不僅僅是為了搜索信息霉囚,更重要的是捕仔,大數(shù)據(jù)可以為我們打開一扇密切觀察自己個(gè)人生活的窗戶,能夠幫助我們實(shí)現(xiàn)自我盈罐。舉個(gè)簡單的例子榜跌,如果我們對(duì)某個(gè)人十年來發(fā)的朋友圈進(jìn)行簡單的n元詞組分析,那么我們便可以了解到關(guān)于他日常生活的許多信息以及變化盅粪。比如钓葫,他以前的朋友圈會(huì)經(jīng)常提到“聚會(huì)”、“酒吧”票顾、“喝酒”這類詞础浮,而后來,這些詞的頻次逐漸下降奠骄,而像“健康”豆同、“早睡早起”、“運(yùn)動(dòng)”這類詞的頻次逐漸提高含鳞,那么我們就可以知道影锈,這十年里他的生活方式發(fā)生了改變,而且也會(huì)根據(jù)可視化圖表得知這些變化是從何時(shí)開始的蝉绷。再比如鸭廷,如果他以前的朋友圈經(jīng)常出現(xiàn)不同的女生名字,而后來漸漸地只出現(xiàn)一個(gè)人的名字潜必,那么我們也可以知道靴姿,從某時(shí)起他的情感生活日趨穩(wěn)定。再比如磁滚,如果他以前的朋友圈經(jīng)常出現(xiàn)消極的詞佛吓,而現(xiàn)在積極的詞匯逐漸增多,那么可以看出垂攘,他對(duì)生活的態(tài)度也發(fā)生了改變……我們的人生是悄無聲息地不斷地在改變的维雇,也許我們意識(shí)不到某個(gè)階段的改變,但如果我們多年后用這種方式對(duì)我們的生活記錄進(jìn)行檢索晒他,我們就會(huì)不斷地發(fā)現(xiàn)自己的變化料仗,重新發(fā)現(xiàn)那些曾經(jīng)對(duì)我們很重要的蔓同,卻慢慢被遺忘、被改變了的東西瓷叫。這種分析能幫助我們更好地認(rèn)識(shí)自己,發(fā)現(xiàn)自己的優(yōu)勢予跌,判斷自己的發(fā)展方向,慢慢地靠近夢想。
3. 突破思維界限咪鲜,科學(xué)與人文走向融合,抓住小趨勢撞鹉,預(yù)見未知疟丙。我從小數(shù)學(xué)就不好,考大學(xué)選專業(yè)時(shí)也毫無懸念地選擇了文科鸟雏。當(dāng)時(shí)我覺得太慶幸了——這輩子終于告別數(shù)學(xué)了享郊。但沒有想到的是,讀研究生的時(shí)候我“上了賊船”孝鹊,讀個(gè)語言學(xué)專業(yè)也要設(shè)計(jì)實(shí)驗(yàn)炊琉,啃統(tǒng)計(jì),分析數(shù)據(jù)惶室。好在我也survive了温自,以為就此可以和數(shù)學(xué)分手快樂了。又沒想到的是皇钞,現(xiàn)在語料庫大數(shù)據(jù)發(fā)展迅速悼泌,如果不繼續(xù)啃,就會(huì)跟不上趨勢夹界。怎么辦馆里?只能繼續(xù)啃。好不容易學(xué)了個(gè)基礎(chǔ)可柿,AI鸠踪、Python編程又開始大行其道,讓英語專業(yè)的孩子們感到岌岌可危复斥,江湖地位不保营密。作為一名“科研工作者”,如果不會(huì)編個(gè)實(shí)驗(yàn)程序目锭,做個(gè)數(shù)據(jù)分析评汰,都會(huì)有點(diǎn)心虛,甚至?xí)绮诫y行痢虹。就這樣被去,我從一個(gè)數(shù)學(xué)考28分的文科生,活生生地被逼得會(huì)編點(diǎn)小程序奖唯,會(huì)做點(diǎn)小統(tǒng)計(jì)惨缆,還會(huì)給人講講小題。目前,數(shù)據(jù)分析在各個(gè)學(xué)科領(lǐng)域都開始展示出它強(qiáng)大的力量坯墨,讓人想不到的是寂汇,人文學(xué)科和社會(huì)科學(xué)居然首當(dāng)其沖。
最后捣染,回到一開始的一個(gè)問題健无。在未來,大數(shù)據(jù)或許能對(duì)人類發(fā)展的趨勢進(jìn)行預(yù)測液斜。人類一切的思想和行為最終都會(huì)記錄在語言和文字中,只要有一個(gè)合適的計(jì)算方法叠穆,我們就能從語言數(shù)據(jù)中觀察出人類文化的變遷少漆。同理,數(shù)據(jù)已經(jīng)不再屬于數(shù)據(jù)科學(xué)家了硼被,來自各行業(yè)示损、各領(lǐng)域的從業(yè)者以及政府都應(yīng)該盡力挖掘數(shù)據(jù)的力量。在這個(gè)時(shí)代嚷硫,人文和科學(xué)的邊界將逐漸模糊检访,業(yè)界和學(xué)界的邊界也將被重新定義。我們準(zhǔn)備好了嗎仔掸?