算法一:快速排序算法
快速排序是由東尼·霍爾所發(fā)展的一種排序算法萄唇。在平均狀況下裁蚁,排序 n 個(gè)項(xiàng)目要Ο(n log n)次比較串塑。在最壞狀況下則需要Ο(n2)次比較舰讹,但這種狀況并不常見。事實(shí)上狸相,快速排序通常明顯比其他Ο(n log n) 算法更快薛匪,因?yàn)樗膬?nèi)部循環(huán)(inner loop)可以在大部分的架構(gòu)上很有效率地被實(shí)現(xiàn)出來。
快速排序使用分治法(Divide and conquer)策略來把一個(gè)串行(list)分為兩個(gè)子串行(sub-lists)脓鹃。
算法步驟:
1 從數(shù)列中挑出一個(gè)元素逸尖,稱為 “基準(zhǔn)”(pivot),
2 重新排序數(shù)列,所有元素比基準(zhǔn)值小的擺放在基準(zhǔn)前面娇跟,所有元素比基準(zhǔn)值大的擺在基準(zhǔn)的后面(相同的數(shù)可以到任一邊)岩齿。在這個(gè)分區(qū)退出之后,該基準(zhǔn)就處于數(shù)列的中間位置苞俘。這個(gè)稱為分區(qū)(partition)操作盹沈。
3 遞歸地(recursive)把小于基準(zhǔn)值元素的子數(shù)列和大于基準(zhǔn)值元素的子數(shù)列排序。
遞歸的最底部情形吃谣,是數(shù)列的大小是零或一乞封,也就是永遠(yuǎn)都已經(jīng)被排序好了。雖然一直遞歸下去,但是這個(gè)算法總會(huì)退出,因?yàn)樵诿看蔚牡╥teration)中淌铐,它至少會(huì)把一個(gè)元素?cái)[到它最后的位置去澜术。
算法二:堆排序算法
堆排序(Heapsort)是指利用堆這種數(shù)據(jù)結(jié)構(gòu)所設(shè)計(jì)的一種排序算法。堆積是一個(gè)近似完全二叉樹的結(jié)構(gòu)惋鸥,并同時(shí)滿足堆積的性質(zhì):即子結(jié)點(diǎn)的鍵值或索引總是小于(或者大于)它的父節(jié)點(diǎn)杂穷。堆排序的平均時(shí)間復(fù)雜度為Ο(nlogn) 。
算法步驟:
1.創(chuàng)建一個(gè)堆H[0..n-1]
2.把堆首(最大值)和堆尾互換
3.把堆的尺寸縮小1卦绣,并調(diào)用shift_down(0),目的是把新的數(shù)組頂端數(shù)據(jù)調(diào)整到相應(yīng)位置
4.重復(fù)步驟2耐量,直到堆的尺寸為1
算法三:歸并排序
歸并排序(Merge sort,臺(tái)灣譯作:合并排序)是建立在歸并操作上的一種有效的排序算法滤港。該算法是采用分治法(Divide and Conquer)的一個(gè)非常典型的應(yīng)用廊蜒。
算法步驟:
- 申請(qǐng)空間,使其大小為兩個(gè)已經(jīng)排序序列之和溅漾,該空間用來存放合并后的序列
- 設(shè)定兩個(gè)指針山叮,最初位置分別為兩個(gè)已經(jīng)排序序列的起始位置
- 比較兩個(gè)指針?biāo)赶虻脑兀x擇相對(duì)小的元素放入到合并空間添履,并移動(dòng)指針到下一位置
- 重復(fù)步驟3直到某一指針達(dá)到序列尾
-
將另一序列剩下的所有元素直接復(fù)制到合并序列尾
算法四:二分查找算法
二分查找算法是一種在有序數(shù)組中查找某一特定元素的搜索算法屁倔。搜素過程從數(shù)組的中間元素開始,如果中間元素正好是要查找的元素暮胧,則搜 素過程結(jié)束锐借;如果某一特定元素大于或者小于中間元素,則在數(shù)組大于或小于中間元素的那一半中查找往衷,而且跟開始一樣從中間元素開始比較钞翔。如果在某一步驟數(shù)組 為空,則代表找不到席舍。這種搜索算法每一次比較都使搜索范圍縮小一半布轿。折半搜索每次把搜索區(qū)域減少一半,時(shí)間復(fù)雜度為Ο(logn) 。
算法五:BFPRT(線性查找算法)
BFPRT算法解決的問題十分經(jīng)典驮捍,即從某n個(gè)元素的序列中選出第k大(第k信蹦拧)的元素,通過巧妙的分 析东且,BFPRT可以保證在最壞情況下仍為線性時(shí)間復(fù)雜度启具。該算法的思想與快速排序思想相似,當(dāng)然珊泳,為使得算法在最壞情況下鲁冯,依然能達(dá)到o(n)的時(shí)間復(fù)雜 度,五位算法作者做了精妙的處理色查。
算法步驟:
- 將n個(gè)元素每5個(gè)一組薯演,分成n/5(上界)組。
- 取出每一組的中位數(shù)秧了,任意排序方法跨扮,比如插入排序。
- 遞歸的調(diào)用selection算法查找上一步中所有中位數(shù)的中位數(shù)验毡,設(shè)為x衡创,偶數(shù)個(gè)中位數(shù)的情況下設(shè)定為選取中間小的一個(gè)。
- 用x來分割數(shù)組晶通,設(shè)小于等于x的個(gè)數(shù)為k璃氢,大于x的個(gè)數(shù)即為n-k。
- 若i==k狮辽,返回x一也;若i<k,在小于x的元素中遞歸查找第i小的元素喉脖;若i>k椰苟,在大于x的元素中遞歸查找第i-k小的元素。
終止條件:n=1時(shí)动看,返回的即是i小元素尊剔。
算法六:DFS(深度優(yōu)先搜索)
深度優(yōu)先搜索算法(Depth-First-Search),是搜索算法的一種菱皆。它沿著樹的深度遍歷樹的節(jié)點(diǎn)须误,盡可能深的搜索樹的分 支。當(dāng)節(jié)點(diǎn)v的所有邊都己被探尋過仇轻,搜索將回溯到發(fā)現(xiàn)節(jié)點(diǎn)v的那條邊的起始節(jié)點(diǎn)京痢。這一過程一直進(jìn)行到已發(fā)現(xiàn)從源節(jié)點(diǎn)可達(dá)的所有節(jié)點(diǎn)為止。如果還存在未被發(fā) 現(xiàn)的節(jié)點(diǎn)篷店,則選擇其中一個(gè)作為源節(jié)點(diǎn)并重復(fù)以上過程祭椰,整個(gè)進(jìn)程反復(fù)進(jìn)行直到所有節(jié)點(diǎn)都被訪問為止臭家。DFS屬于盲目搜索。
深度優(yōu)先搜索是圖論中的經(jīng)典算法方淤,利用深度優(yōu)先搜索算法可以產(chǎn)生目標(biāo)圖的相應(yīng)拓?fù)渑判虮矶ち蓿猛負(fù)渑判虮砜梢苑奖愕慕鉀Q很多相關(guān)的圖論問題,如最大路徑問題等等携茂。一般用堆數(shù)據(jù)結(jié)構(gòu)來輔助實(shí)現(xiàn)DFS算法你踩。
算法步驟:
- 訪問頂點(diǎn)v;
- 依次從v的未被訪問的鄰接點(diǎn)出發(fā)讳苦,對(duì)圖進(jìn)行深度優(yōu)先遍歷带膜;直至圖中和v有路徑相通的頂點(diǎn)都被訪問;
- 若此時(shí)圖中尚有頂點(diǎn)未被訪問鸳谜,則從一個(gè)未被訪問的頂點(diǎn)出發(fā)膝藕,重新進(jìn)行深度優(yōu)先遍歷,直到圖中所有頂點(diǎn)均被訪問過為止咐扭。
上述描述可能比較抽象芭挽,舉個(gè)實(shí)例:
DFS 在訪問圖中某一起始頂點(diǎn) v 后,由 v 出發(fā)草描,訪問它的任一鄰接頂點(diǎn) w1览绿;再從 w1 出發(fā),訪問與 w1鄰 接但還沒有訪問過的頂點(diǎn) w2穗慕;然后再從 w2 出發(fā),進(jìn)行類似的訪問妻导,… 如此進(jìn)行下去逛绵,直至到達(dá)所有的鄰接頂點(diǎn)都被訪問過的頂點(diǎn) u 為止。
接著倔韭,退回一步术浪,退到前一次剛訪問過的頂點(diǎn),看是否還有其它沒有被訪問的鄰接頂點(diǎn)寿酌。如果有胰苏,則訪問此頂點(diǎn),之后再從此頂點(diǎn)出發(fā)醇疼,進(jìn)行與前述類似的訪問硕并;如果沒有,就再退回一步進(jìn)行搜索秧荆。重復(fù)上述過程倔毙,直到連通圖中所有頂點(diǎn)都被訪問過為止。
算法七:BFS(廣度優(yōu)先搜索)
廣度優(yōu)先搜索算法(Breadth-First-Search)乙濒,是一種圖形搜索算法陕赃。簡(jiǎn)單的說卵蛉,BFS是從根節(jié)點(diǎn)開始,沿著樹(圖)的寬度遍歷樹(圖)的節(jié)點(diǎn)么库。如果所有節(jié)點(diǎn)均被訪問傻丝,則算法中止。BFS同樣屬于盲目搜索诉儒。一般用隊(duì)列數(shù)據(jù)結(jié)構(gòu)來輔助實(shí)現(xiàn)BFS算法葡缰。
算法步驟:
- 首先將根節(jié)點(diǎn)放入隊(duì)列中。
- 從隊(duì)列中取出第一個(gè)節(jié)點(diǎn)允睹,并檢驗(yàn)它是否為目標(biāo)运准。
如果找到目標(biāo),則結(jié)束搜尋并回傳結(jié)果缭受。
否則將它所有尚未檢驗(yàn)過的直接子節(jié)點(diǎn)加入隊(duì)列中胁澳。 - 若隊(duì)列為空,表示整張圖都檢查過了——亦即圖中沒有欲搜尋的目標(biāo)米者。結(jié)束搜尋并回傳“找不到目標(biāo)”韭畸。
-
重復(fù)步驟2。
算法八:Dijkstra算法
戴克斯特拉算法(Dijkstra’s algorithm)是由荷蘭計(jì)算機(jī)科學(xué)家艾茲赫爾·戴克斯特拉提出蔓搞。迪科斯徹算法使用了廣度優(yōu)先搜索解決非負(fù)權(quán)有向圖的單源最短路徑問題胰丁,算法最終得到一個(gè)最短路徑樹。該算法常用于路由算法或者作為其他圖算法的一個(gè)子模塊喂分。
該算法的輸入包含了一個(gè)有權(quán)重的有向圖 G锦庸,以及G中的一個(gè)來源頂點(diǎn) S。我們以 V 表示 G 中所有頂點(diǎn)的集合蒲祈。每一個(gè)圖中的邊甘萧,都是兩個(gè)頂點(diǎn)所形成的有序元素對(duì)。(u, v) 表示從頂點(diǎn) u 到 v 有路徑相連梆掸。我們以 E 表示G中所有邊的集合扬卷,而邊的權(quán)重則由權(quán)重函數(shù) w: E → [0, ∞] 定義。因此酸钦,w(u, v) 就是從頂點(diǎn) u 到頂點(diǎn) v 的非負(fù)權(quán)重(weight)怪得。邊的權(quán)重可以想像成兩個(gè)頂點(diǎn)之間的距離。任兩點(diǎn)間路徑的權(quán)重卑硫,就是該路徑上所有邊的權(quán)重總和徒恋。已知有 V 中有頂點(diǎn) s 及 t,Dijkstra 算法可以找到 s 到 t的最低權(quán)重路徑(例如拔恰,最短路徑)因谎。這個(gè)算法也可以在一個(gè)圖中,找到從一個(gè)頂點(diǎn) s 到任何其他頂點(diǎn)的最短路徑颜懊。對(duì)于不含負(fù)權(quán)的有向圖财岔,Dijkstra算法是目前已知的最快的單源最短路徑算法风皿。
算法步驟:
- 初始時(shí)令 S={V0},T={其余頂點(diǎn)},T中頂點(diǎn)對(duì)應(yīng)的距離值
若存在<V0,Vi>匠璧,d(V0,Vi)為<V0,Vi>弧上的權(quán)值
若不存在<V0,Vi>桐款,d(V0,Vi)為∞ - 從T中選取一個(gè)其距離值為最小的頂點(diǎn)W且不在S中,加入S
- 對(duì)其余T中頂點(diǎn)的距離值進(jìn)行修改:若加進(jìn)W作中間頂點(diǎn)夷恍,從V0到Vi的距離值縮短魔眨,則修改此距離值
重復(fù)上述步驟2、3酿雪,直到S中包含所有頂點(diǎn)遏暴,即W=Vi為止
算法九:動(dòng)態(tài)規(guī)劃算法
動(dòng)態(tài)規(guī)劃(Dynamic programming)是一種在數(shù)學(xué)、計(jì)算機(jī)科學(xué)和經(jīng)濟(jì)學(xué)中使用的指黎,通過把原問題分解為相對(duì)簡(jiǎn)單的子問題的方式求解復(fù)雜問題的方法朋凉。 動(dòng)態(tài)規(guī)劃常常適用于有重疊子問題和最優(yōu)子結(jié)構(gòu)性質(zhì)的問題,動(dòng)態(tài)規(guī)劃方法所耗時(shí)間往往遠(yuǎn)少于樸素解法醋安。
動(dòng)態(tài)規(guī)劃背后的基本思想非常簡(jiǎn)單杂彭。大致上,若要解一個(gè)給定問題吓揪,我們需要解其不同部分(即子問題)亲怠,再合并子問題的解以得出原問題的解。 通常許多 子問題非常相似柠辞,為此動(dòng)態(tài)規(guī)劃法試圖僅僅解決每個(gè)子問題一次团秽,從而減少計(jì)算量: 一旦某個(gè)給定子問題的解已經(jīng)算出,則將其記憶化存儲(chǔ)叭首,以便下次需要同一個(gè) 子問題解之時(shí)直接查表徙垫。 這種做法在重復(fù)子問題的數(shù)目關(guān)于輸入的規(guī)模呈指數(shù)增長時(shí)特別有用。
關(guān)于動(dòng)態(tài)規(guī)劃最經(jīng)典的問題當(dāng)屬背包問題放棒。
算法步驟:
- 最優(yōu)子結(jié)構(gòu)性質(zhì)。如果問題的最優(yōu)解所包含的子問題的解也是最優(yōu)的己英,我們就稱該問題具有最優(yōu)子結(jié)構(gòu)性質(zhì)(即滿足最優(yōu)化原理)间螟。最優(yōu)子結(jié)構(gòu)性質(zhì)為動(dòng)態(tài)規(guī)劃算法解決問題提供了重要線索。
- 子問題重疊性質(zhì)损肛。子問題重疊性質(zhì)是指在用遞歸算法自頂向下對(duì)問題進(jìn)行求解時(shí)厢破,每次產(chǎn)生的子問題并不總是新問題,有些子問題會(huì)被重復(fù)計(jì)算多次治拿。 動(dòng)態(tài)規(guī)劃算法正是利用了這種子問題的重疊性質(zhì)摩泪,對(duì)每一個(gè)子問題只計(jì)算一次,然后將其計(jì)算結(jié)果保存在一個(gè)表格中劫谅,當(dāng)再次需要計(jì)算已經(jīng)計(jì)算過的子問題時(shí)见坑,只是 在表格中簡(jiǎn)單地查看一下結(jié)果嚷掠,從而獲得較高的效率。
算法十:樸素貝葉斯分類算法
樸素貝葉斯分類算法是一種基于貝葉斯定理的簡(jiǎn)單概率分類算法荞驴。貝葉斯分類的基礎(chǔ)是概率推理不皆,就是在各種條件的存在不確定,僅知其出現(xiàn)概率的情況下熊楼, 如何完成推理和決策任務(wù)霹娄。概率推理是與確定性推理相對(duì)應(yīng)的。而樸素貝葉斯分類器是基于獨(dú)立假設(shè)的鲫骗,即假設(shè)樣本每個(gè)特征與其他特征都不相關(guān)犬耻。
樸素貝葉斯分類器依靠精確的自然概率模型,在有監(jiān)督學(xué)習(xí)的樣本集中能獲取得非常好的分類效果执泰。在許多實(shí)際應(yīng)用中枕磁,樸素貝葉斯模型參數(shù)估計(jì)使用最大似然估計(jì)方法,換言之樸素貝葉斯模型能工作并沒有用到貝葉斯概率或者任何貝葉斯模型坦胶。
盡管是帶著這些樸素思想和過于簡(jiǎn)單化的假設(shè)透典,但樸素貝葉斯分類器在很多復(fù)雜的現(xiàn)實(shí)情形中仍能夠取得相當(dāng)好的效果。
關(guān)注我的公眾號(hào)顿苇,不止有技術(shù)哦~