本文高度劇透涝动,沒看過原著的朋友請(qǐng)速速退散。
《解憂雜貨店》作為東野圭吾不那么東野圭吾的一部作品侥加,自出版以來就常年占據(jù)暢銷書排行榜前列捧存。近一年來作為大熱IP,更是被兩次翻拍為電影担败。
前兩年第一次看這本書的時(shí)候昔穴,我有被書中獨(dú)特的故事內(nèi)容和連接手法小小驚艷到,《解憂雜貨店》確實(shí)是一部好作品提前。
最近心血來潮吗货,決定拿《解憂雜貨店》的電子文本做一個(gè)小小的文本分析練習(xí),這篇文章即為這次練習(xí)的產(chǎn)物狈网。
需要聲明宙搬,由于文本是譯本,所以分析結(jié)果更多地是基于譯者的寫作風(fēng)格拓哺。此外勇垛,譯本很多(比如,這個(gè)電子版和我看過的紙質(zhì)版就略有差異)士鸥,這篇分析僅基于我手上拿到的這個(gè)版本闲孤。
首先,先來看一下小說的詞云圖(已排除常見停用詞)烤礁。
詞語越大讼积,代表該詞語在小說中出現(xiàn)的次數(shù)越多肥照。
可以看到,這部小說涉及的主要人物有敦也勤众、浩介舆绎、晴美、翔太们颜、克郎吕朵、雄治、貴之等掌桩,主要涉及的地點(diǎn)是浪矢雜貨店边锁。
其他的高頻詞姑食,如回信波岛、煩惱、夢想等等音半,在一定程度上可以讓我們對(duì)小說的劇情管中窺豹则拷。
整部小說(譯本)一共有多少句話呢?
我以句號(hào)曹鸠、問號(hào)煌茬、感嘆號(hào)為單位拇涤,把小說文本拆分成句子紫皇。得到的結(jié)果是州邢,整部小說一共有6894個(gè)句子榜贴。
全書一共有五章慢哈,那么每一章的句子總數(shù)是否有明顯差別呢鼓鲁?
從上圖可以看到音同,第二请敦、三章的句子總數(shù)相對(duì)較少肆饶,第四改衩、第五章用的筆墨則相對(duì)較多。
五章的標(biāo)題分別是:
- 回答在牛奶箱里
- 深夜的口琴聲
- 在思域車上等到天亮
- 聽著披頭士默禱
- 來自天上的祈禱
現(xiàn)在來看看小說中的句子字?jǐn)?shù)分布驯镊。
句子字?jǐn)?shù)程長尾分布葫督,絕大多數(shù)句子包含的中文字?jǐn)?shù)不超過60個(gè),平均每個(gè)句子有18個(gè)字板惑。
看完了整體的句子字?jǐn)?shù)分布橄镜,再來看看每一章的句子字?jǐn)?shù)分布是否有差別。
總的來說冯乘,每一章的句子字?jǐn)?shù)分布大致相同洽胶,但后幾章的句子比前幾章的句子字?jǐn)?shù)要稍微多一些。
看完了句子字?jǐn)?shù)往湿,再來看看句子詞數(shù)妖异。下圖是各句子的詞數(shù)分布圖惋戏。
絕大多數(shù)句子包含的詞數(shù)不超過40個(gè),并且其中很大一部分句子的詞數(shù)不超過16個(gè)他膳。此外响逢,平均句子詞數(shù)為11。
同樣的棕孙,看完了整體舔亭,再看看各章節(jié)的分布對(duì)比。
各章節(jié)的句子詞數(shù)分布差不多蟀俊,但整體而言钦铺,第一章的句子比其他的要稍短。
現(xiàn)在肢预,來看看主要人物和地點(diǎn)的出現(xiàn)次數(shù)分布矛洞。
需要說明,絕大多數(shù)人物的名字出現(xiàn)次數(shù)為TA所有名稱的總和烫映,比如沼本,“武藤晴美”的出現(xiàn)次數(shù)代表“武藤晴美”、“晴美”和“迷途的小狗”(她寫信時(shí)用的昵稱)這三個(gè)名字出現(xiàn)次數(shù)的總和锭沟。
出乎我意料的是,出現(xiàn)次數(shù)最多的人物不是作為浪矢雜貨店店主的雄治族淮,也不是引出小說故事的敦也辫红、翔太、幸平祝辣,而是到了第四章才出場的浩介贴妻。
我們?cè)賮砜纯疵恳徽碌?strong>關(guān)鍵詞。
這里较幌,詞語的關(guān)鍵程度由詞語的TF-IDF值決定揍瑟,TF-IDF值越大,表明詞語越關(guān)鍵乍炉。
第一章的關(guān)鍵人物是翔太绢片、敦也、幸平岛琼,人名以外的主要名詞有車子底循、防盜器、牛皮紙等等槐瑞。這些詞語能讓你聯(lián)想到什么樣的劇情呢熙涤?
第二章的關(guān)鍵人物無疑是克郎,其余關(guān)鍵詞有許多和音樂相關(guān),比如歌迷祠挫、曲子那槽、作曲者。對(duì)比之下可以看到等舔,這一章的故事情境和上一章差異不小骚灸。
第三章的主要關(guān)鍵人物是貴之和駿吾,地點(diǎn)是浪矢雜貨店和東京慌植。猜一猜貴之和駿吾甚牲,與浪矢雜貨店之間有什么樣的聯(lián)系呢?
第四章迎來了我們?cè)谌闹忻直惶峒白疃嗟娜宋铩平榈痢k娪霸赫筛啤④囌尽膳_(tái)交汤,浩介的故事看起來像是圍繞深夜展開的雏赦,你覺得呢?
從圖上顯示的詞語來看蜻展,最后一章仿佛是在展開了無數(shù)個(gè)故事之后喉誊,又繞回到了最初的人物和地點(diǎn)上,且這一章中纵顾,敦也的比重比他的另兩位小伙伴要大很多。
從以上五份關(guān)鍵詞排名中栋盹,我們可以隱約看到施逾,《解憂雜貨店》的每一章描述了不同的人物故事,而這些人物之間似乎存在著一些若有若無的聯(lián)系例获。
最后汉额,來看看小說的情感曲線。
前兩天無意中看到某篇數(shù)據(jù)分析文章里談到小說情感曲線榨汤,覺得很有意思蠕搜,就試著自己做了一下,得出來的結(jié)果還不錯(cuò)收壕。
曲線已做平滑化處理妓灌。
圖中橫軸表示劇情的時(shí)間線,縱軸表示劇情的情感方向蜜宪,虛線對(duì)應(yīng)的情感值為0虫埂,虛線以上表明該時(shí)間點(diǎn)上的劇情偏積極(積極詞多于消極詞),虛線以下表明該時(shí)間點(diǎn)上的劇情偏消極(消極詞多于積極詞)圃验,縱軸絕對(duì)值越大表明劇情情感越強(qiáng)烈掉伏。
小說的情感曲線大致呈「雙W」型,即多個(gè)高潮低谷交錯(cuò)出現(xiàn)。各個(gè)波峰波谷對(duì)應(yīng)的劇情已在圖上標(biāo)出斧散。
值得注意的是供常,整個(gè)曲線除了最后一部分,其他部分的情感分值都相對(duì)較低鸡捐,這可能和日本小說本身的平淡風(fēng)格有關(guān)话侧。
另外,最后的高分值部分基本上對(duì)應(yīng)的是第五章的劇情闯参,結(jié)合前面關(guān)鍵詞部分的分析可以看出整部小說的敘事結(jié)構(gòu):一開始先通過不同章節(jié)展開不同的故事瞻鹏,最后再把各個(gè)故事連接起來形成一個(gè)“大團(tuán)圓”式的結(jié)局。
這種結(jié)構(gòu)可以說非常典型了鹿寨,但盡管如此新博,里面的細(xì)節(jié)設(shè)置還是非常有趣的,推薦還沒看過小說的朋友去讀一讀脚草。
最后的最后赫悄,再推薦一下真人版電影(日版),劇情基本上可以說是神還原了馏慨。
以上埂淮。