當密碼學遇上統(tǒng)計學

標題取的很大劲厌,主要是為了將文章上升到科學的層次路呜,而不僅僅是某一項具體的應(yīng)用。

本文簡述卡方統(tǒng)計量的思想轻掩,及其在Caesar加密破解中的應(yīng)用幸乒。

Caesar 加密,將每個字母用其在字母表之后的某個位置的字母代替唇牧,比如用d代替a罕扎, e代替bf代替c丐重,對于z腔召,用c代替。1 如果將a, b, c, ..., z 從0開始編號扮惦,這種替換的過程臀蛛,可以看成是字母的循環(huán)右移(或者左移)。在古典加密中崖蜜,這個位置參數(shù)是保密的掺栅,如果被第三方知道,密文也就隨之破解纳猪。

320px-Caesar3.svg.png

比如每個字母右移12位氧卧,將 "All models are wrong, but some are useful."通過Caesar加密,得到如下密文:
"Mxx yapqxe mdq idazs, ngf eayq mdq geqrgx."

加密后的文本不可讀氏堤,但若得到位置信息沙绝,即可將每個字母左移12位搏明,即可得到原文。如果不知道這個位置信息闪檬,就需要暴力窮舉星著,對于Caesar加密而言,只有25種情況(因為看到的密文已經(jīng)是一種)粗悯,這適合用計算來解決虚循。

再進一步論述之前,需要說說英語本身的一種特性样傍。在英語中横缔,每個字母出現(xiàn)的頻次是不一樣的,有的很高衫哥,有的很少出現(xiàn)茎刚,比如字母e經(jīng)常出現(xiàn),而字母z則很少出現(xiàn)撤逢。理論上膛锭,可以得到每個字母的出現(xiàn)百分比。

a b c d e f g h i j k l m
8.2 1.5 2.8 4.3 12.7 2.2 2 6.1 7 0.2 0.8 4 2.4
n o p q r s t u v w x y z
6.7 7.5 1.9 0.1 6 6.3 9.1 2.8 1 2.4 0.2 2 0.1

對于Caesar加密蚊荣,雖然字母被映射成別的字母初狰,但是也將相應(yīng)字母的出現(xiàn)頻率映射給新的字母,比如出現(xiàn)幾率最高的e互例,如果被映射成h奢入,則在Caesar加密后,統(tǒng)計詞頻敲霍,可以發(fā)現(xiàn)h的出現(xiàn)幾率最高俊马。對于其他的字母,有類似的情況肩杈。這也為通過詞頻破解Caesar加密提供了思路柴我。

對于一段密文,左移(或者右移)扩然,然后統(tǒng)計其詞頻艘儒,并與標準的英語字母詞頻做比較。若移動的位數(shù)正好是Caesar加密所使用的位數(shù)夫偶,則每個字母的詞頻與標準英語字母的詞頻比較接近界睁,否則相差應(yīng)該較大。這種差異可以通過卡方統(tǒng)計量來刻畫兵拢,

對于26個字母翻斟,在標準英語下,每個字母具有比例$\pi_{1i}$说铃,其中$i = 1, 2, 3, .., 26$访惜;對于待解密的文本嘹履,某次移動后,每個字母的出現(xiàn)頻率為$\pi_{2i}$债热,其中$i = 1, 2, 3, ..., 26$砾嫉。

可以構(gòu)建極大似然統(tǒng)計量,當文本較多時窒篱,可以等價地構(gòu)建皮爾遜卡方統(tǒng)計量焕刮。[2][]

$$\chi^2 = n\sum_{i = 1} ^{26} \frac{ (\pi_{2i} - \pi_{1i})^2 } { \pi_{1i} }$$

其中$n$是帶解密文本中字母的個數(shù)。如果$\pi_{2i}$與$\pi_{1i}$一致墙杯,則該統(tǒng)計量較小配并,否則該統(tǒng)計量較大。也就是說卡方統(tǒng)計量的大小衡量移位后詞頻與標準詞頻之間的匹配程度霍转。對于Caesar加密荐绝,窮舉所有可能的移位一汽,計算其對應(yīng)的卡方統(tǒng)計量避消,其最小值對應(yīng)的文本,很有可能是正確解密的文本召夹。由于對于一段固定的密文岩喷,$n$是常數(shù),故可在計算中忽略不計监憎。

$$\chi^2 = \sum_{i = 1} ^{26} \frac{ (\pi_{2i} - \pi_{1i})^2 } { \pi_{1i} }$$

[2]: John A. Rice, 數(shù)理統(tǒng)計與數(shù)據(jù)分析, page 263.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末纱意,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子鲸阔,更是在濱河造成了極大的恐慌偷霉,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件褐筛,死亡現(xiàn)場離奇詭異类少,居然都是意外死亡,警方通過查閱死者的電腦和手機渔扎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門硫狞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人晃痴,你說我怎么就攤上這事残吩。” “怎么了倘核?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵泣侮,是天一觀的道長。 經(jīng)常有香客問我紧唱,道長活尊,這世上最難降的妖魔是什么祖凫? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮酬凳,結(jié)果婚禮上惠况,老公的妹妹穿的比我還像新娘。我一直安慰自己宁仔,他們只是感情好稠屠,可當我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著翎苫,像睡著了一般权埠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上煎谍,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天攘蔽,我揣著相機與錄音,去河邊找鬼呐粘。 笑死满俗,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的作岖。 我是一名探鬼主播唆垃,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼痘儡!你這毒婦竟也來了辕万?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤沉删,失蹤者是張志新(化名)和其女友劉穎渐尿,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矾瑰,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡砖茸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了脯倚。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片渔彰。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖推正,靈堂內(nèi)的尸體忽然破棺而出恍涂,到底是詐尸還是另有隱情,我是刑警寧澤植榕,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布再沧,位于F島的核電站,受9級特大地震影響尊残,放射性物質(zhì)發(fā)生泄漏炒瘸。R本人自食惡果不足惜淤堵,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望顷扩。 院中可真熱鬧拐邪,春花似錦、人聲如沸隘截。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽婶芭。三九已至东臀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間犀农,已是汗流浹背惰赋。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留呵哨,地道東北人赁濒。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像仇穗,于是被迫代替她去往敵國和親流部。 傳聞我的和親對象是個殘疾皇子戚绕,可洞房花燭夜當晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容