第一章:文字和語言vs數(shù)字和信息
![](https://img3.doubanio.com/lpic/s9114855.jpg)
這一章是《數(shù)學(xué)之美》的第一章。
與之前《浪潮之巔》不同,不是直接講述現(xiàn)代科技,而是結(jié)合原始人類的歷史漸漸引出語言文字的發(fā)展揩尸,并且與數(shù)字信息進行對比,并結(jié)合 “信息傳輸過程”屁奏、“羅薩塔石碑”岩榆、“文言文與口語”、“圣經(jīng)抄寫”坟瓢、“莎士比亞戲劇原文”講述了數(shù)字和語言文字有著共同的作用——傳遞信息朗恳。
首先說一說為什么會產(chǎn)生語言文字。
人們的生活經(jīng)驗载绿,作為那個時代最寶貴的資源,隨著社會發(fā)展越來越多油航,初期人們能依靠記憶崭庸,但后來,沒有人能記住所有內(nèi)容谊囚,于是高效怕享、準確記錄信息的方法必須產(chǎn)生——即是語言文字×ぃ可以想象函筋,對于沒有衍生出語言文字的物種,只能依靠基因一點點進化來增加記憶容量奠伪。我認為這是非常緩慢的跌帐,也許這也就是為什么其他物種都被人類所支配吧,畢竟他們都不具語言文字绊率,進化是非常緩慢的谨敛。
信息傳輸過程
信息 | → | 信息 | → | 信息 |
---|---|---|---|---|
說話人-信息源 | (說話的聲音-編碼) | (信道) | (聽到聲音-解碼) | (接受者) |
這個非常有趣,盡管經(jīng)過幾千年的發(fā)展滤否,本質(zhì)的原理是沒有變化的脸狸。下面還要提到幾個例子,比如文言文和口語藐俺。書中講到炊甲,當時時代背景決定了每一個用物理方式記錄下來的文字成本都是非常高的泥彤,所以人們惜墨如金,盡可能壓縮原信息卿啡,而口語卻沒什么晦澀難懂吟吝。回顧歷史牵囤,清代的小說像《紅樓夢》很容易讀懂爸黄,至于為什么會慢慢演變喃?我想也就是因為造紙術(shù)的進一步發(fā)展揭鳞,降低了寫字成本的原因吧炕贵。我以前總是疑惑,為什么文言文會逐步演化成白話文野崇,今天動腦一想就明白了称开,并不是演化成白話文,而是本來就是白話文乓梨,演化的只是記錄的文字罷了鳖轰。
還有一個例子是生僻字與常用字筆畫復(fù)雜度的不同。對于現(xiàn)在學(xué)過哈夫曼編碼的我們可以輕易理解扶镀,但這一切不是很巧妙嗎蕴侣?那時候人肯本不懂信息論的概念,但源自身的需求自然而然就演變成了同樣的方式臭觉。
下面列舉兩個字 : 天(tian) 鷆(tian) 這兩個字都是我mac 輸入法里面隨便找的...
再說一下《圣經(jīng)》抄寫的故事昆雀。
《圣經(jīng)》主要分《舊約》和《新約》(約90~100萬字) ,《耶路撒冷三千年》里面講好像《新約》是在基督圣殿經(jīng)過一次毀滅之后再寫成的蝠筑。兩部都是多人合作校訂完成狞膘,大約有幾個世紀。這么多年時間什乙,肯定需要抄寫前人的內(nèi)容挽封,一個不可避免的問題就是抄錯〕剂停可是如何檢查抄錯辅愿?猶太人想了一個類似現(xiàn)在校驗碼的東西:每個字有一個hash值,把每行每列hash求和忆某,與原文對比渠缕,看是否正確。上學(xué)期學(xué)了《計算機網(wǎng)絡(luò)》里面也有這樣一種校驗方式褒繁,也許就是根據(jù)猶太人這個典故而產(chǎn)生的亦鳞。這里我總聯(lián)想起《三體》里面講到三體星人模擬計算機運算的故事......
最后說一個羅賽塔的典故。
講的公元七世紀,羅馬燕差、希臘都曾占領(lǐng)國埃及遭笋,所以留下了一篇由三種文字寫成的碑文。在拿破侖鐵騎來到埃及的時候徒探,隨從的百名語言學(xué)家發(fā)現(xiàn)并破譯了碑文內(nèi)容瓦呼,為后世了解古埃及文明做無與倫比貢獻。書中說這也是為什么現(xiàn)在許多翻譯軟件叫 羅賽塔 的原因测暗。雖然我至今未用過一款叫 羅賽塔 的東西…
文中還夾雜著許多有趣的知識和典故央串,相信由很多是我的水平看不到的,希望同樣看過的人能與我分享碗啄。