大數(shù)據(jù)最核心的關鍵技術——32個算法

奧地利符號計算研究所的Christoph Koutschan博士在自己的頁面上發(fā)布了一篇文章禁偎,提到他做了一個調(diào)查鞍泉,參與者大多數(shù)是計算機科學家烟逊,他請這些科學家投票選出最重要的算法嫌褪,以下是這次調(diào)查的結果枣耀,按照英文名稱字母順序排序在扰。

1缕减、A* 搜索算法——圖形搜索算法,從給定起點到給定終點計算出路徑。其中使用了一種啟發(fā)式的估算,為每個節(jié)點估算通過該節(jié)點的最佳路徑掠兄,并以之為各個地點排定次序竞川。算法以得到的次序訪問這些節(jié)點袋坑。因此坝橡,A*搜索算法是最佳優(yōu)先搜索的范例枷恕。

2筏养、集束搜索(又名定向搜索嫂易,Beam Search)——最佳優(yōu)先搜索算法的優(yōu)化兄朋。使用啟發(fā)式函數(shù)評估它檢查的每個節(jié)點的能力。不過炬搭,集束搜索只能在每個深度中發(fā)現(xiàn)最前面的m個最符合條件的節(jié)點蜈漓,m是固定數(shù)字——集束的寬度。

3宫盔、二分查找(Binary Search)——在線性數(shù)組中找特定值的算法融虽,每個步驟去掉一半不符合要求的數(shù)據(jù)。

4灼芭、分支界定算法(Branch and Bound)——在多種最優(yōu)化問題中尋找特定最優(yōu)化解決方案的算法有额,特別是針對離散、組合的最優(yōu)化彼绷。

5巍佑、Buchberger算法——一種數(shù)學算法,可將其視為針對單變量最大公約數(shù)求解的歐幾里得算法和線性系統(tǒng)中高斯消元法的泛化寄悯。

6萤衰、數(shù)據(jù)壓縮——采取特定編碼方案,使用更少的字節(jié)數(shù)(或是其他信息承載單元)對信息編碼的過程猜旬,又叫來源編碼脆栋。

7、Diffie-Hellman密鑰交換算法——一種加密協(xié)議洒擦,允許雙方在事先不了解對方的情況下椿争,在不安全的通信信道中,共同建立共享密鑰熟嫩。該密鑰以后可與一個對稱密碼一起秦踪,加密后續(xù)通訊。

8掸茅、Dijkstra算法——針對沒有負值權重邊的有向圖椅邓,計算其中的單一起點最短算法。

9昧狮、離散微分算法(Discrete differentiation)景馁。

10、動態(tài)規(guī)劃算法(Dynamic Programming)——展示互相覆蓋的子問題和最優(yōu)子架構算法

11陵且、歐幾里得算法(Euclidean algorithm)——計算兩個整數(shù)的最大公約數(shù)裁僧。最古老的算法之一,出現(xiàn)在公元前300前歐幾里得的《幾何原本》慕购。

12聊疲、期望-最大算法(Expectation-maximization algorithm,又名EM-Training)——在統(tǒng)計計算中沪悲,期望-最大算法在概率模型中尋找可能性最大的參數(shù)估算值获洲,其中模型依賴于未發(fā)現(xiàn)的潛在變量。EM在兩個步驟中交替計算殿如,第一步是計算期望贡珊,利用對隱藏變量的現(xiàn)有估計值,計算其最大可能估計值;第二步是最大化涉馁,最大化在第一步上求得的最大可能值來計算參數(shù)的值门岔。

13、快速傅里葉變換(Fast Fourier transform烤送,F(xiàn)FT)——計算離散的傅里葉變換(DFT)及其反轉(zhuǎn)寒随。該算法應用范圍很廣,從數(shù)字信號處理到解決偏微分方程帮坚,到快速計算大整數(shù)乘積妻往。

14、梯度下降(Gradient descent)——一種數(shù)學上的最優(yōu)化算法试和。

15讯泣、哈希算法(Hashing)。

16阅悍、堆排序(Heaps)好渠。

17、Karatsuba乘法——需要完成上千位整數(shù)的乘法的系統(tǒng)中使用溉箕,比如計算機代數(shù)系統(tǒng)和大數(shù)程序庫晦墙,如果使用長乘法,速度太慢肴茄。該算法發(fā)現(xiàn)于1962年晌畅。

18、LLL算法(Lenstra-Lenstra-Lovasz lattice reduction)——以格規(guī)約(lattice)基數(shù)為輸入寡痰,輸出短正交向量基數(shù)抗楔。LLL算法在以下公共密鑰加密方法中有大量使用:背包加密系統(tǒng)(knapsack)、有特定設置的RSA加密等等拦坠。

19连躏、最大流量算法(Maximum flow)——該算法試圖從一個流量網(wǎng)絡中找到最大的流。它優(yōu)勢被定義為找到這樣一個流的值贞滨。最大流問題可以看作更復雜的網(wǎng)絡流問題的特定情況入热。最大流與網(wǎng)絡中的界面有關拍棕,這就是最大流-最小截定理(Max-flow min-cut theorem)。Ford-Fulkerson 能找到一個流網(wǎng)絡中的最大流勺良。

20绰播、合并排序(Merge Sort)。

21尚困、牛頓法(Newton's method)——求非線性方程(組)零點的一種重要的迭代法蠢箩。

22、Q-learning學習算法——這是一種通過學習動作值函數(shù)(action-value function)完成的強化學習算法事甜,函數(shù)采取在給定狀態(tài)的給定動作谬泌,并計算出期望的效用價值,在此后遵循固定的策略逻谦。Q-leanring的優(yōu)勢是掌实,在不需要環(huán)境模型的情況下,可以對比可采納行動的期望效用邦马。

23潮峦、兩次篩法(Quadratic Sieve)——現(xiàn)代整數(shù)因子分解算法,在實踐中勇婴,是目前已知第二快的此類算法(僅次于數(shù)域篩法Number Field Sieve)忱嘹。對于110位以下的十位整數(shù),它仍是最快的耕渴,而且都認為它比數(shù)域篩法更簡單拘悦。

24、RANSAC——是“RANdom SAmple Consensus”的縮寫橱脸。該算法根據(jù)一系列觀察得到的數(shù)據(jù)础米,數(shù)據(jù)中包含異常值,估算一個數(shù)學模型的參數(shù)值添诉。其基本假設是:數(shù)據(jù)包含非異化值屁桑,也就是能夠通過某些模型參數(shù)解釋的值,異化值就是那些不符合模型的數(shù)據(jù)點栏赴。

25蘑斧、RSA——公鑰加密算法。首個適用于以簽名作為加密的算法须眷。RSA在電商行業(yè)中仍大規(guī)模使用竖瘾,大家也相信它有足夠安全長度的公鑰。

26花颗、Sch?nhage-Strassen算法——在數(shù)學中捕传,Sch?nhage-Strassen算法是用來完成大整數(shù)的乘法的快速漸近算法。其算法復雜度為:O(N log(N) log(log(N)))扩劝,該算法使用了傅里葉變換庸论。

27职辅、單純型算法(Simplex Algorithm)——在數(shù)學的優(yōu)化理論中,單純型算法是常用的技術聂示,用來找到線性規(guī)劃問題的數(shù)值解罐农。線性規(guī)劃問題包括在一組實變量上的一系列線性不等式組,以及一個等待最大化(或最小化)的固定線性函數(shù)催什。

28、奇異值分解(Singular value decomposition宰睡,簡稱SVD)——在線性代數(shù)中蒲凶,SVD是重要的實數(shù)或復數(shù)矩陣的分解方法,在信號處理和統(tǒng)計中有多種應用拆内,比如計算矩陣的偽逆矩陣(以求解最小二乘法問題)旋圆、解決超定線性系統(tǒng)(overdetermined linear systems)、矩陣逼近麸恍、數(shù)值天氣預報等等灵巧。

29、求解線性方程組(Solving a system of linear equations)——線性方程組是數(shù)學中最古老的問題抹沪,它們有很多應用刻肄,比如在數(shù)字信號處理、線性規(guī)劃中的估算和預測融欧、數(shù)值分析中的非線性問題逼近等等敏弃。求解線性方程組,可以使用高斯—約當消去法(Gauss-Jordan elimination)噪馏,或是柯列斯基分解( Cholesky decomposition)麦到。

30、Strukturtensor算法——應用于模式識別領域欠肾,為所有像素找出一種計算方法瓶颠,看看該像素是否處于同質(zhì)區(qū)域( homogenous region),看看它是否屬于邊緣刺桃,還是是一個頂點粹淋。

31、合并查找算法(Union-find)——給定一組元素瑟慈,該算法常常用來把這些元素分為多個分離的廓啊、彼此不重合的組。不相交集(disjoint-set)的數(shù)據(jù)結構可以跟蹤這樣的切分方法封豪。合并查找算法可以在此種數(shù)據(jù)結構上完成兩個有用的操作:

查找:判斷某特定元素屬于哪個組谴轮。

合并:聯(lián)合或合并兩個組為一個組。

32吹埠、維特比算法(Viterbi algorithm)——尋找隱藏狀態(tài)最有可能序列的動態(tài)規(guī)劃算法第步,這種序列被稱為維特比路徑疮装,其結果是一系列可以觀察到的事件,特別是在隱藏的Markov模型中粘都。

以上就是Christoph博士對于最重要的算法的調(diào)查結果廓推。你們熟悉哪些算法?又有哪些算法是你們經(jīng)常使用的?

結語

感謝您的觀看,如有不足之處翩隧,歡迎批評指正。

如果有對大數(shù)據(jù)感興趣的小伙伴或者是從事大數(shù)據(jù)的老司機可以加群:

658558542? ? (?點擊即可加入群聊

里面整理了一大份學習資料专缠,全都是些干貨涝婉,包括大數(shù)據(jù)技術入門,海量數(shù)據(jù)高級分析語言蔗怠,海量數(shù)據(jù)存儲分布式存儲墩弯,以及海量數(shù)據(jù)分析分布式計算等部分,送給每一位大數(shù)據(jù)小伙伴寞射,這里不止是小白聚集地渔工,還有大牛在線解答!歡迎初學和進階中的小伙伴一起進群學習交流桥温,共同進步涨缚!

最后祝福所有遇到瓶頸的大數(shù)據(jù)程序員們突破自己,祝福大家在往后的工作與面試中一切順利。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末通惫,一起剝皮案震驚了整個濱河市茂翔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌履腋,老刑警劉巖珊燎,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異延旧,居然都是意外死亡谋国,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進店門迁沫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芦瘾,“玉大人捌蚊,你說我怎么就攤上這事〗埽” “怎么了缅糟?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長祷愉。 經(jīng)常有香客問我窗宦,道長,這世上最難降的妖魔是什么二鳄? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任赴涵,我火速辦了婚禮,結果婚禮上泥从,老公的妹妹穿的比我還像新娘。我一直安慰自己沪摄,他們只是感情好躯嫉,可當我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著杨拐,像睡著了一般祈餐。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上哄陶,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天帆阳,我揣著相機與錄音,去河邊找鬼屋吨。 笑死蜒谤,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的至扰。 我是一名探鬼主播鳍徽,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼敢课!你這毒婦竟也來了阶祭?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤直秆,失蹤者是張志新(化名)和其女友劉穎濒募,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體圾结,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡瑰剃,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了筝野。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片培他。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡鹃两,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出舀凛,到底是詐尸還是另有隱情俊扳,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布猛遍,位于F島的核電站馋记,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏懊烤。R本人自食惡果不足惜梯醒,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望腌紧。 院中可真熱鬧茸习,春花似錦、人聲如沸壁肋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽浸遗。三九已至猫胁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間跛锌,已是汗流浹背弃秆。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留髓帽,地道東北人菠赚。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像郑藏,于是被迫代替她去往敵國和親锈至。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容