一個基于信息論的人生觀(上)
信息論的價值觀是要求選擇權(quán)猜绣、多樣性、不確定性和自由度菌瘫。我們不只想老老實實地活著,我們還想活出“信息”來布卡。
想在這個世界上留下自己的痕跡。
“信息”雇盖,是現(xiàn)代世界一個非常重要的觀念忿等。你肯定已經(jīng)聽過“比特”、“信息熵”之類的詞了崔挖,這些概念似乎都比較技術(shù)化贸街,那不搞技術(shù)的人也需要了解它們嗎庵寞?
非常需要。信息論并不僅僅是一個技術(shù)理論薛匪,更是一個具有普世價值的思想捐川。了解了信息論,你就多了一個觀察世界的眼光逸尖。你甚至可以從信息論中推導出一個人生觀來古沥。
1.信息與冗余
1. 怎想再很,末第鐸制釋能鎖其那策銅怎亞娇跟,狄幺瀨互梯是日方通的岩齿。
2. 對這些村民來說,星期天是休息的日子苞俘,至少不需要到田地里干活盹沈。
第一條消息是胡亂打出來的字,第二條消息則是剛剛獲得諾貝爾文學獎的石黑一雄的小說《被掩埋的巨人》中的一句話吃谣。請問乞封,哪條消息的“信息量”,更大岗憋?
直覺上來說肃晚,你可能認為第二條的信息量更大,因為它至少是一個信息澜驮,而第一條完全是亂碼陷揪。但第二條消息其實只不過是看起來更有*意義*而已 —— 信息量更大的是第一條。
這第二條消息中有很多*多余*的字杂穷。即便把其中有些字給去掉悍缠,留下空白,你也能猜到它們是什么字耐量。比如說 ——
“星期__是__休__的日__”
你一看就能猜到這句話是“星期天是休息的日子”飞蚓。
這就是說,第二條消息廊蜒,是*可壓縮*的趴拧。
而第一條消息就不一樣了,我拿掉任何一個字山叮,你都肯定猜不出來它是哪個字著榴。這是一條*不可壓縮*的信息。至于說這條消息有沒有*意義*屁倔,那是另外一回事脑又,也許它是一個密碼,也許它是一些人名和地名的組合,但關(guān)鍵在于问麸,你無法省略其中任何一個字往衷。
這就是說,一段消息所包含的信息严卖,并不僅僅由這條消息的長短決定席舍。這就好像人生一樣,活了同樣歲數(shù)的兩個人哮笆,他們的人生經(jīng)歷的豐富程度可能大不相同来颤。
那怎么衡量“信息”呢?
2.香農(nóng)的洞見
有些字看起來是多余的疟呐,它們并不提供新信息脚曾。有些字雖然不算多余,但是我們猜也能猜出個八九不離十启具,那么它們提供的信息量也就比較小本讥。
比如說 ——
“至少不需要到田地里干__”
你猜最后空格這個字是什么?漢語中以“干”開頭的詞并不多鲁冯,適合放在這里的無非是“干活”拷沸、“干事”、“干仗”這幾種情況之一∈硌荩現(xiàn)在告訴你這個字是“活”撞芍,你肯定不會感到驚訝 —— 所以“活”這個字提供的信息很少。
現(xiàn)代信息論的祖師爺跨扮,克勞德·艾爾伍德·香農(nóng)(Claude Elwood Shannon)序无,有一個洞見:一個東西的信息量的大小,在于它克服了多少*不確定性*衡创。
先舉一個生活中的例子帝嗡。比如現(xiàn)在有一個人,生活非常規(guī)律璃氢,平時就出現(xiàn)在四個地方:家里哟玷、公司、餐館一也、健身房巢寡。如果雇你做特工,觀察這個人椰苟,隨時匯報他的位置抑月,那你每次給的信息無非就是“家里/公司/餐館/健身房”四選一 —— 即使你不說也有四分之一的把握猜對。所以你給的信息價值不算太大舆蝴。
可是如果這個人全世界到處跑爪幻,今天在土耳其明天在沙特阿拉伯我完全猜不到他在哪菱皆,那你給的信息可就非常值錢了。
你的信息出來之前挨稿,這個人的位置對我來說是一種不確定性。你的信息京痢,克服了這個不確定性奶甘。原來的不確定性越大,你的信息就越有價值祭椰。
可供選擇的范圍越廣臭家,選擇的信息量就越大。
3.信息熵
香農(nóng)從統(tǒng)計物理學中借鑒了一個概念方淤,這就是“信息熵”钉赁。不要被這個名詞嚇到!其實所謂信息熵携茂,就是一段消息的“平均信息量”你踩。
先說“信息量”。一個東西的信息量的大小取決于它克服了多大的不確定性讳苦。香農(nóng)對信息量的定義非常簡單带膜,如果一個字符出現(xiàn)在這個位置的概率是 p,那么這個字符的信息量 I 就是 ——
I = - log2(p)
其中那個“l(fā)og”就是以2為底的對數(shù)鸳谜,這是初中數(shù)學膝藕!
假設(shè)有一個完美公正的硬幣,每次拋出正面朝上的概率都是1/2咐扭,那么這一次拋硬幣的結(jié)果是正面朝上芭挽,這個消息的信息量就是 ——
- log2(1/2) = 1.
信息熵,就是把一條消息中出現(xiàn)的所有字符蝗肪,做信息量的加權(quán)平均 ——
還是用硬幣的例子袜爪,用1表示正面朝上,0表示反面朝上穗慕,一系列投擲結(jié)果可能是——
0011100101
如果正反面出現(xiàn)的概率都正好是1/2饿敲,那這一串消息不管有多長,信息熵都是 1/2*1+1/2*1 = 1.香農(nóng)規(guī)定信息量的單位是“比特”逛绵,那么這個信息熵就是1比特怀各。
這意味著,對消息中的*每個*字符术浪,你*至少需要*1比特的信息才能編碼瓢对。
如果這個硬幣不公平,出現(xiàn)1的次數(shù)比出現(xiàn)0要多胰苏,比如說
1101110011
那信息熵就不是1比特了硕蛹,對這個例子來說,0出現(xiàn)的概率是30%,1出現(xiàn)的概率是70%法焰,所以信息熵就變成了 ——
[0.3*log2(0.3)+0.7*log2(0.7)] = 0.88 比特秧荆。
信息熵跟消息的長度沒有必然關(guān)系,它描寫的是這段消息中字符的“不可預(yù)測性”埃仪。一段字符串中出現(xiàn)的各種字符越具有雜亂無章的特點乙濒,越具有多樣性,它的信息熵就越高卵蛉。比如下面這個字符串 ——
asdogrpfkn
每個字母都不一樣颁股,它的信息熵是3.3 比特。而如果字符串中有很多重復(fù)的傻丝,那么它的“可預(yù)測性”就更高甘有,信息熵就會變低,比如——
asdfasdfooasop
的信息熵只有 2.5 比特葡缰。
注意這里為了簡化亏掀,計算只考慮了字符出現(xiàn)的頻率。如果你從語法和內(nèi)容角度進一步考慮每個字符的可預(yù)測性运准,信息熵就是另一個數(shù)值了幌氮。
信息熵之所以叫“熵”,是因為它跟統(tǒng)計物理學中熵的公式幾乎一樣胁澳。在物理學里“熵”大致描寫了一個系統(tǒng)的混亂程度 —— 而信息熵也是如此该互,越是看上去雜亂無章的消息,信息熵就越高韭畸,也就是說它的信息含量就越高宇智。
如果一段消息只能從0和1兩個數(shù)字中選,它的信息熵最大也只有1比特胰丁。如果你能從26個字母中選随橘,信息熵最大可以達到4.7比特。如果是從2500個漢字中選锦庸,信息熵則可以達到11.3比特机蔗。這就是為什么中文是一種更高效的語言。
數(shù)學部分到此為止甘萧。如果沒看懂萝嘁,只要記住一句話就行:可供選擇的范圍越廣,選擇的信息量就越大扬卷。
4.空話與人生
這個關(guān)于信息量的概念牙言,出自香農(nóng)1948年的論文,《通訊的數(shù)學原理》怪得,當時的香農(nóng)只有32歲咱枉。這個理論一出來就受到了熱烈歡迎卑硫,人們感覺是耳目一新。香農(nóng)的一個同事蚕断,瓦倫·韋弗(Warren Weaver)欢伏,是這么向公眾講解信息論的 ——
“從信息角度來看,最重要的不是你*說了*什么亿乳,而是你*能說*什么 颜懊。”
比如某個公司的 CEO 講話风皿,說的都是空話、套話 —— 他說前半句你就能猜到后半句匠璧,他一說“團結(jié)”桐款,你就知道后面是“一致向前看”,他一說“萬眾”夷恍,后面跟著肯定是“一心”魔眨,那他就算講三個小時也毫無信息量。他必須得說一些讓你根本預(yù)測不了的話酿雪,才有信息量遏暴。
信息,在于你從多大的不確定性中做出了選擇指黎。信息朋凉,在于你制造了多少意外。信息醋安,在于你有多大的自由度杂彭。
比如現(xiàn)在有個人,每天都按時上班從不遲到吓揪。他今天來上班了亲怠,請問這是新聞嗎?當然不是柠辞,這個消息的信息量等于0团秽。而另有一個人,想上班就上班想不上班就不上班叭首,他今天來上班了习勤,這才是一個新聞。第二個人放棒,比第一個人擁有更多自由姻报。
我們每個人都希望能度過值得回憶的一生,最好還是“值得記錄”的一生间螟。那所謂值得記錄吴旋,不就是提供了有效的信息嗎损肛?
從信息角度來講,人生就是要活一個“選擇權(quán)”荣瑟。如果你從來都是按部就班不敢越雷池半步地生活治拿,干什么都是高度可預(yù)測的,那你的人生就不值得記錄笆焰。而如果你的生活跌宕起伏充滿意外劫谅,那就值得記錄,甚至值得出自傳拍電視劇嚷掠。
比如上級交給你一個任務(wù)捏检,任務(wù)已經(jīng)非常明確告訴你第一步干什么、第二步干什么不皆、到什么地方贯城、找什么人接洽、話術(shù)又要怎么說霹娄。如果你只能完全按照這個劇本執(zhí)行任務(wù)能犯,請問你貢獻了什么信息呢?沒有犬耻。你沒有自由度踩晶。
反過來說,如果你有能力不按劇本走枕磁,你敢給自己加戲渡蜻,在關(guān)鍵時刻有選擇權(quán),你做的事兒讓圍觀群眾感到很意外透典,你才算是留下了信息晴楔!
所以信息論的價值觀是要求選擇權(quán)、多樣性峭咒、不確定性和自由度税弃。我們不只想老老實實地活著,我們還想活出“信息”來凑队。
我們想在這個世界上留下自己的痕跡则果。
可是,如果是這樣漩氨,我們?yōu)槭裁催€經(jīng)常說一些空話和套話呢西壮?為什么我們在和別人打交道的過程中,還保留了很高的可預(yù)測性呢叫惊?
一個基于信息論的人生觀(下)
既要有創(chuàng)造性款青,又要可預(yù)測,這才是合理的信息輸出霍狰。
信息就是意外抡草。從“信息論”這個維度出發(fā)饰及,有兩種事情是特別值得我們?nèi)プ龅模?/p>
1. 出乎別人意料的事;
2. 給自己增加選項的事康震。
香農(nóng)關(guān)于信息的第一個洞見:一個東西真正的信息量燎含,在于它克服了多大的不確定性。這個洞見給我們提供了一個觀察世界的眼光腿短。有了這個眼光屏箍,你再看身邊很多東西,其實都沒什么信息量橘忱。
1.怎樣把信息量最大化
一個香農(nóng)本人設(shè)計的例子赴魁,請聽下面這句英文 ——
Most people have little difficulty in reading this sentence.
非常簡單的一句話。而香農(nóng)說钝诚,這句話中有很多冗余的字符尚粘!比如就算把其中所有的元音字母都去掉,如果你英文比較熟練敲长,你也能猜出來這句話是什么 ——
Mst ppl hv lttl dffclty n rdng ths sntnc.
對吧?這第二句話能夠表達同樣的意思秉继,而顯然比第一句提供了更多的信息密集度祈噪。據(jù)我所知,有些古代文明的文字尚辑,就根本沒有元音字母辑鲤,讓你自己猜。
這個去除一句話中的冗余字符的過程杠茬,就是“壓縮”月褥。其實這句話還可以進一步壓縮,比如其中的介詞(in)和定冠詞(this)瓢喉,就算沒有你也知道是什么意思宁赤。咱們中國的文言文,大約就是一種高度壓縮的文體栓票,言簡意賅决左,特別省竹簡。
香農(nóng)認為英語是冗余度非常高的一種語言走贪,一般英文文本中75%的字符都是多余的佛猛。
漢字的信息熵比英文字母高很多,所以同樣長度的一句中文和英文坠狡,中文的信息量就會高出許多继找。同樣的一本書,如果翻譯成中文逃沿,就會薄出許多婴渡。最高效的文本幻锁,應(yīng)該像是亂碼一樣,讓你找不到任何規(guī)律缩搅。
非吃桨埽可惜的是,信息革命真正開始改變世界的時候硼瓣,香農(nóng)已經(jīng)得了老年癡呆癥究飞。香農(nóng)年輕的時代,他這個理論并沒有得到很好的應(yīng)用堂鲤,當時所謂的通訊無非也就是發(fā)發(fā)電報亿傅、打打電話,字符壓縮不壓縮的意義不大瘟栖。等到互聯(lián)網(wǎng)普及之后葵擎,音頻和視頻的壓縮可就太關(guān)鍵了,沒有壓縮算法我們就不可能在計算機上聽音樂和看電影半哟。香農(nóng)沒有發(fā)明具體的壓縮算法酬滤,但是所有壓縮算法都用到了香農(nóng)的觀念。
如果壓縮是傳播信息的高效辦法寓涨,那我們平時說話為什么不盡量壓縮一下盯串,為什么容忍那么大的語言冗余度呢?首要的原因是有噪聲戒良。
2.香農(nóng)的第二個洞見
在香農(nóng)發(fā)表信息論之前体捏,困擾貝爾實驗室科學家的一個問題是怎么克服通訊過程中的噪聲。一段電碼的傳送過程中糯崎,噪聲可能會把原本的0變成1几缭,把1變成0。一開始人們的想法都是把信號放大沃呢,讓信號的強度遠遠高于噪聲 —— 但這其實是個囚徒困境年栓!因為如果每條通訊都扯著嗓子喊,聲音是越來越大了薄霜,但是互相之間的干擾也越來越強韵洋,彼此都是對方的噪聲,等于是信號越強黄锤,噪聲也越強搪缨!
香農(nóng)的第二個洞見就是,克服噪聲的正確辦法鸵熟,是增加信息的冗余度副编。
一個最簡單的例子。假設(shè)要傳遞的消息都是由 ABCD 四個字母組成的流强,而傳遞的方式是用 0 和 1 兩個數(shù)字對這四個字母編碼痹届。最高效的編碼方式呻待,是兩個數(shù)字對應(yīng)一個字母,比如 ——
A = 00
B = 01
C = 10
D = 11
根據(jù)這個編碼队腐,“000110”就是“ABC”蚕捉,簡單明了。但是這個編碼系統(tǒng)有危險柴淘,因為如果傳遞過程中有噪聲迫淹,把其中第二個0變成了1,那整個信息就成了 010110为严,那就成了BBC了敛熬!
怎么解決這個問題呢?香農(nóng)說第股,你應(yīng)該給編碼增加一些冗余度应民。比如你可以用五個數(shù)字代表一個字母 ——
A = 00000
B = 00111
C = 11100
D = 11011
這樣一來,哪怕傳播過程中出了錯夕吻,你看到“00001”這樣的非法編碼诲锹,也能立即猜到它是 A!
想想這個道理涉馅。日常說話不就是這樣嗎辕狰?我們的話都有很大的冗余度,有時候啰里啰嗦一個意思說好幾遍控漠,但是這樣能確保你即便有幾個字沒聽清楚,也能知道我說的是什么意思悬钳。而如果我這篇文章是用文言文寫的盐捷,那你可能就沒法聽懂音頻了。
后世所有的信息編碼系統(tǒng)都要考慮到出錯和糾錯問題默勾,基本原理正是香農(nóng)說的增加冗余度碉渡。所以說,想要讓別人充分理解你的意思母剥,最好的辦法不是用更大的聲音對著他喊滞诺,而是多給他說幾遍。
3.可預(yù)測和不可預(yù)測
信息的本質(zhì)是克服了多少不確定性环疼,也就是不可預(yù)測习霹。而冗余度的本質(zhì)恰恰是提高可預(yù)測性。
那么從信息論角度炫隶,人生面臨一個矛盾淋叶。一方面你希望自己活得更有效率,能給世界留下更多信息伪阶,那做事就要有創(chuàng)造性煞檩,越不可預(yù)測越好处嫌。另一方面,你又要跟人好好交流斟湃,那就要增加冗余度熏迹,給別人一個合理的預(yù)期,讓人覺得你是可預(yù)測的凝赛,這樣才能形成合作注暗。如果一個人連上一次班都是新聞,那就太不靠譜了哄酝。
既要有創(chuàng)造性友存,又要可預(yù)測,這才是合理的信息輸出陶衅。這個道理有點像我們第一季多次說過的 “喜歡 = 熟悉 + 意外”屡立,但這里從信息輸出的角度,它的應(yīng)用更為廣泛搀军。
比如說寫文章膨俐,如果你的觀點非常新,語言又特別簡練罩句,那信息量就太大焚刺,別人很可能難以理解。而如果你文章中的道理很少门烂,車轱轆話卻說了很多乳愉,那也不行。信息量到底要多少才好屯远?這是一個藝術(shù)蔓姚,你得慢慢摸索。在我看來慨丐,增加文字的冗余度唯一的好處就是方便別人接收坡脐,只要讀者能理解、能記住房揭,信息就應(yīng)該越密集越好备闲。
反過來說,讀書捅暴,則是一個*接收*信息的問題√裆埃現(xiàn)在有各種關(guān)于“速讀”的說法,而從信息論的角度蓬痒,閱讀速度并不是由你眼球轉(zhuǎn)動的速度決定的觉既。
接受一段信息速度的快慢,取決于這段信息對我們來說,在多大程度上是*可預(yù)測*的瞪讼。
如果作者說上半句你就知道下半句钧椰,作者說一個典故的開頭你就知道結(jié)局,那么這本書你顯然就可以讀得非撤罚快嫡霞。而如果這本書的內(nèi)容對你來說是全新的,讀到哪一段都一驚一乍希柿,那你就只能慢慢細讀诊沪。
所以一個人讀書速度的快慢,從根本上來說曾撤,是取決于這個人以前讀過多少書端姚。對一個領(lǐng)域了解越多,讀這個領(lǐng)域的新書就越快挤悉。小說看多了渐裸,再看新小說就覺得到處都是俗套。
那么如此說來装悲,閱讀的過程其實是讀者和作者之間的一場較量昏鹃!作者使出各種手段讓讀者預(yù)測不到他下一步要說什么,而讀者一旦預(yù)測成功诀诊,就會有一種戰(zhàn)勝了作者的感覺洞渤。
再進一步,還可以從接收信息和輸出信息這個視角審視一下人生属瓣。
平時學習知識载迄、積累經(jīng)驗,就是要減少世界給自己的不確定性抡蛙。新人看哪里都新鮮护昧,老手看哪里都是俗套 —— 只有這樣,他才能從一大堆可預(yù)測的事物之中敏感地抓住那些不尋常之處溜畅,那才是真正有價值的信息。
而我們做事极祸,則要給世界增加一點不確定性慈格!別人都以為我會這么做,然后我就真的這么做了遥金,那我跟一臺機器有什么區(qū)別浴捆?我要輸出信息,就得做一些別人想不到我會做的事稿械。
信息就是意外选泻。從“信息論”這個維度出發(fā),有兩種事情是特別值得去做的:
出乎別人意料的事桨菜;
給自己增加選項的事萧锉。
做事出乎意料身害,你做的這件事才值得被記住桩皿。有更多的選項缠劝,你才有能力做出乎意料的事左痢。有選擇權(quán)的人也可能故意做一些可預(yù)測的事來促進交流和合作 —— 但只要你真的擁有選擇權(quán)裳凸,那就不管你是選了 A 還是選了 B薄货,都是真的信息碌奉。選項 = 自由度短曾。
難道做事不應(yīng)該多做好事少做壞事嗎?為了出乎意料而去做一些損人不利己的事赐劣,這也行嗎嫉拐?當然不行。但是請注意魁兼,這里說的僅僅是信息論這一個維度婉徘。人生有很多維度,好人壞人是另一個維度璃赡。一個恪盡職守的士兵在邊境線上站了三年崗判哥,他做的事很對也很好,但是不值得記錄碉考。一個不負責任的醫(yī)生違反操作規(guī)程把病人治死了塌计,他做的事很壞,但是值得記錄下來侯谁。
當然锌仅,并不是所有人都想給這個世界留下信息。說的是如果你想留下信息墙贱,你應(yīng)該怎么做热芹。
一句電影《辛德勒的名單》里的臺詞。這句話大意是說惨撇,按照規(guī)定去殺人伊脓,那不能算你有權(quán)力,你并不真的掌握別人的命運 ——
什么叫權(quán)力呢魁衙?“權(quán)力是我們有充分的理由去殺一個人报腔,但是我們不殺∑实恚”