1. 快速排序
快速排序是由東尼·霍爾所發(fā)展的一種排序算法惭笑。在平均狀況下仓坞,排序 n 個項目要Ο(n log n)次比較帆阳。在最壞狀況下則需要Ο(n2)次比較迎吵,但這種狀況并不常見嗤形。事實上精偿,快速排序通常明顯比其他Ο(n log n) 算法更快,因為它的內(nèi)部循環(huán)(inner loop)可以在大部分的架構(gòu)上很有效率地被實現(xiàn)出來赋兵。
快速排序使用分治法(Divide and conquer)策略來把一個串行(list)分為兩個子串行(sub-lists)笔咽。
算法步驟
- 從數(shù)列中挑出一個元素,稱為 “基準”(pivot)
- 重新排序數(shù)列霹期,所有元素比基準值小的擺放在基準前面叶组,所有元素比基準值大的擺在基準的后面(相同的數(shù)可以到任一邊)。在這個分區(qū)退出之后经伙,該基準就處于數(shù)列的中間位置扶叉。這個稱為分區(qū)(partition)操作
- 遞歸地(recursive)把小于基準值元素的子數(shù)列和大于基準值元素的子數(shù)列排序
遞歸的最底部情形勿锅,是數(shù)列的大小是零或一,也就是永遠都已經(jīng)被排序好了枣氧。雖然一直遞歸下去溢十,但是這個算法總會退出,因為在每次的迭代(iteration)中达吞,它至少會把一個元素擺到它最后的位置去张弛。
2. 堆排序
堆排序(Heapsort)是指利用堆這種數(shù)據(jù)結(jié)構(gòu)所設(shè)計的一種排序算法。堆積是一個近似完全二叉樹的結(jié)構(gòu)酪劫,并同時滿足堆積的性質(zhì):即子結(jié)點的鍵值或索引總是小于(或者大于)它的父節(jié)點吞鸭。
堆排序的平均時間復雜度為Ο(nlogn) 。
算法步驟
- 創(chuàng)建一個堆H[0..n-1]
- 把堆首(最大值)和堆尾互換
- 把堆的尺寸縮小1覆糟,并調(diào)用shift_down(0),目的是把新的數(shù)組頂端數(shù)據(jù)調(diào)整到相應位置
- 重復步驟2刻剥,直到堆的尺寸為1
3. 歸并排序
歸并排序(Merge sort,臺灣譯作:合并排序)是建立在歸并操作上的一種有效的排序算法滩字。該算法是采用分治法(Divide and Conquer)的一個非常典型的應用造虏。
算法步驟
- 申請空間,使其大小為兩個已經(jīng)排序序列之和麦箍,該空間用來存放合并后的序列
- 設(shè)定兩個指針漓藕,最初位置分別為兩個已經(jīng)排序序列的起始位置
- 比較兩個指針所指向的元素,選擇相對小的元素放入到合并空間挟裂,并移動指針到下一位置
- 重復步驟3直到某一指針達到序列尾
- 將另一序列剩下的所有元素直接復制到合并序列尾
4. 二分查找算法
二分查找算法是一種在有序數(shù)組中查找某一特定元素的搜索算法享钞。
算法步驟
- 搜素過程從數(shù)組的中間元素開始,如果中間元素正好是要查找的元素诀蓉,則搜 素過程結(jié)束
- 如果某一特定元素大于或者小于中間元素栗竖,則在數(shù)組大于或小于中間元素的那一半中查找,而且跟開始一樣從中間元素開始比較交排。
- 如果在某一步驟數(shù)組 為空划滋,則代表找不到。這種搜索算法每一次比較都使搜索范圍縮小一半埃篓。
折半搜索每次把搜索區(qū)域減少一半处坪,時間復雜度為Ο(logn) 。
5. BFPRT(線性查找算法)
BFPRT算法解決的問題十分經(jīng)典架专,即從某n個元素的序列中選出第k大(第k型健)的元素,通過巧妙的分 析部脚,BFPRT可以保證在最壞情況下仍為線性時間復雜度想邦。該算法的思想與快速排序思想相似,當然委刘,為使得算法在最壞情況下丧没,依然能達到o(n)的時間復雜 度鹰椒,五位算法作者做了精妙的處理。
算法步驟
- 將n個元素每5個一組呕童,分成n/5(上界)組漆际。
- 取出每一組的中位數(shù),任意排序方法夺饲,比如插入排序奸汇。
- 遞歸的調(diào)用selection算法查找上一步中所有中位數(shù)的中位數(shù),設(shè)為x往声,偶數(shù)個中位數(shù)的情況下設(shè)定為選取中間小的一個擂找。
- 用x來分割數(shù)組,設(shè)小于等于x的個數(shù)為k浩销,大于x的個數(shù)即為n-k贯涎。
- 若i==k,返回x慢洋;若i<k柬采,在小于x的元素中遞歸查找第i小的元素;若i>k且警,在大于x的元素中遞歸查找第i-k小的元素。
終止條件:n=1時礁遣,返回的即是i小元素斑芜。
6. BFPRT(線性查找算法)
深度優(yōu)先搜索算法(Depth-First-Search),是搜索算法的一種祟霍。它沿著樹的深度遍歷樹的節(jié)點杏头,盡可能深的搜索樹的分 支。當節(jié)點v 的所有邊都己被探尋過沸呐,搜索將回溯到發(fā)現(xiàn)節(jié)點v的那條邊的起始節(jié)點醇王。這一過程一直進行到已發(fā)現(xiàn)從源節(jié)點可達的所有節(jié)點為止。如果還存在未被發(fā) 現(xiàn)的節(jié)點崭添,則選擇其中一個作為源節(jié)點并重復以上過程寓娩,整個進程反復進行直到所有節(jié)點都被訪問為止。DFS屬于盲目搜索呼渣。
深度優(yōu)先搜索是圖論中的經(jīng)典算法棘伴,利用深度優(yōu)先搜索算法可以產(chǎn)生目標圖的相應拓撲排序表,利用拓撲排序表可以方便的解決很多相關(guān)的圖論問題屁置,如最大路徑問題等等焊夸。一般用堆數(shù)據(jù)結(jié)構(gòu)來輔助實現(xiàn)DFS算法。
算法步驟
- 訪問頂點v蓝角;
- 依次從v的未被訪問的鄰接點出發(fā)阱穗,對圖進行深度優(yōu)先遍歷饭冬;直至圖中和v有路徑相通的頂點都被訪問;
- 若此時圖中尚有頂點未被訪問揪阶,則從一個未被訪問的頂點出發(fā)昌抠,重新進行深度優(yōu)先遍歷,直到圖中所有頂點均被訪問過為止遣钳。
上述描述可能比較抽象扰魂,舉個實例:
DFS 在訪問圖中某一起始頂點 v 后,由 v 出發(fā)蕴茴,訪問它的任一鄰接頂點 w1劝评;再從 w1 出發(fā),訪問與 w1鄰 接但還沒有訪問過的頂點 w2倦淀;然后再從 w2 出發(fā)蒋畜,進行類似的訪問,… 如此進行下去撞叽,直至到達所有的鄰接頂點都被訪問過的頂點 u 為止姻成。
接著,退回一步愿棋,退到前一次剛訪問過的頂點科展,看是否還有其它沒有被訪問的鄰接頂點。如果有糠雨,則訪問此頂點才睹,之后再從此頂點出發(fā),進行與前述類似的訪問甘邀;如果沒有琅攘,就再退回一步進行搜索。重復上述過程松邪,直到連通圖中所有頂點都被訪問過為止坞琴。
7. BFS(廣度優(yōu)先搜索)
廣度優(yōu)先搜索算法(Breadth-First-Search),是一種圖形搜索算法逗抑。簡單的說剧辐,BFS是從根節(jié)點開始,沿著樹(圖)的寬度遍歷樹(圖)的節(jié)點邮府。如果所有節(jié)點均被訪問浙于,則算法中止。BFS同樣屬于盲目搜索挟纱。一般用隊列數(shù)據(jù)結(jié)構(gòu)來輔助實現(xiàn)BFS算法。
算法步驟
- 首先將根節(jié)點放入隊列中紊服。
- 從隊列中取出第一個節(jié)點胸竞,并檢驗它是否為目標参萄。
如果找到目標卫枝,則結(jié)束搜尋并回傳結(jié)果。
否則將它所有尚未檢驗過的直接子節(jié)點加入隊列中讹挎。 - 若隊列為空,表示整張圖都檢查過了——亦即圖中沒有欲搜尋的目標筒溃。結(jié)束搜尋并回傳“找不到目標”。
- 重復步驟2怜奖。
8. Dijkstra算法
戴克斯特拉算法(Dijkstra’s algorithm)是由荷蘭計算機科學家艾茲赫爾·戴克斯特拉提出浑测。迪科斯徹算法使用了廣度優(yōu)先搜索解決非負權(quán)有向圖的單源最短路徑問題,算法最終得到一個最短路徑樹歪玲。該算法常用于路由算法或者作為其他圖算法的一個子模塊。
該算法的輸入包含了一個有權(quán)重的有向圖 G岖圈,以及G中的一個來源頂點 S。我們以 V 表示 G 中所有頂點的集合幅狮。每一個圖中的邊株灸,都是兩個頂點所形成的有序元素對擎值。(u, v) 表示從頂點 u 到 v 有路徑相連慌烧。我們以 E 表示G中所有邊的集合鸠儿,而邊的權(quán)重則由權(quán)重函數(shù) w: E → [0, ∞] 定義。因此汹粤,w(u, v) 就是從頂點 u 到頂點 v 的非負權(quán)重(weight)。邊的權(quán)重可以想像成兩個頂點之間的距離嘱兼。任兩點間路徑的權(quán)重贤徒,就是該路徑上所有邊的權(quán)重總和汇四。已知有 V 中有頂點 s 及 t踢涌,Dijkstra 算法可以找到 s 到 t的最低權(quán)重路徑(例如,最短路徑)睁壁。這個算法也可以在一個圖中,找到從一個頂點 s 到任何其他頂點的最短路徑行剂。對于不含負權(quán)的有向圖,Dijkstra算法是目前已知的最快的單源最短路徑算法钉疫。
算法步驟
- 初始時令 S={V0},T={其余頂點}硼讽,T中頂點對應的距離值
若存在<v0,vi>,d(V0,Vi)為<v0,vi>弧上的權(quán)值
若不存在<v0,vi>牲阁,d(V0,Vi)為∞ - 從T中選取一個其距離值為最小的頂點W且不在S中,加入S
- 對其余T中頂點的距離值進行修改:若加進W作中間頂點备燃,從V0到Vi的距離值縮短凌唬,則修改此距離值
- 重復上述步驟2、3客税,直到S中包含所有頂點,即W=Vi為止
9. 動態(tài)規(guī)劃算法
動態(tài)規(guī)劃(Dynamic programming)是一種在數(shù)學测垛、計算機科學和經(jīng)濟學中使用的秧均,通過把原問題分解為相對簡單的子問題的方式求解復雜問題的方法。 動態(tài)規(guī)劃常常適用于有重疊子問題和最優(yōu)子結(jié)構(gòu)性質(zhì)的問題锯七,動態(tài)規(guī)劃方法所耗時間往往遠少于樸素解法誉己。
動態(tài)規(guī)劃背后的基本思想非常簡單。大致上,若要解一個給定問題地消,我們需要解其不同部分(即子問題)畏妖,再合并子問題的解以得出原問題的解。 通常許多 子問題非常相似戒劫,為此動態(tài)規(guī)劃法試圖僅僅解決每個子問題一次,從而減少計算量: 一旦某個給定子問題的解已經(jīng)算出巫橄,則將其記憶化存儲茵典,以便下次需要同一個 子問題解之時直接查表。 這種做法在重復子問題的數(shù)目關(guān)于輸入的規(guī)模呈指數(shù)增長時特別有用统阿。
關(guān)于動態(tài)規(guī)劃最經(jīng)典的問題當屬背包問題。
算法步驟
- 最優(yōu)子結(jié)構(gòu)性質(zhì)帆离。如果問題的最優(yōu)解所包含的子問題的解也是最優(yōu)的结澄,我們就稱該問題具有最優(yōu)子結(jié)構(gòu)性質(zhì)(即滿足最優(yōu)化原理)。最優(yōu)子結(jié)構(gòu)性質(zhì)為動態(tài)規(guī)劃算法解決問題提供了重要線索麻献。
- 子問題重疊性質(zhì)。子問題重疊性質(zhì)是指在用遞歸算法自頂向下對問題進行求解時监婶,每次產(chǎn)生的子問題并不總是新問題餐曼,有些子問題會被重復計算多次鲜漩。 動態(tài)規(guī)劃算法正是利用了這種子問題的重疊性質(zhì),對每一個子問題只計算一次孕似,然后將其計算結(jié)果保存在一個表格中,當再次需要計算已經(jīng)計算過的子問題時养渴,只是 在表格中簡單地查看一下結(jié)果,從而獲得較高的效率翘紊。
10. 樸素貝葉斯分類算法
樸素貝葉斯分類算法是一種基于貝葉斯定理的簡單概率分類算法藐唠。貝葉斯分類的基礎(chǔ)是概率推理,就是在各種條件的存在不確定宇立,僅知其出現(xiàn)概率的情況下, 如何完成推理和決策任務柳琢。概率推理是與確定性推理相對應的润脸。而樸素貝葉斯分類器是基于獨立假設(shè)的,即假設(shè)樣本每個特征與其他特征都不相關(guān)津函。
樸素貝葉斯分類器依靠精確的自然概率模型,在有監(jiān)督學習的樣本集中能獲取得非常好的分類效果涩馆。在許多實際應用中允坚,樸素貝葉斯模型參數(shù)估計使用最大似然估計方法,換言之樸素貝葉斯模型能工作并沒有用到貝葉斯概率或者任何貝葉斯模型稠项。
如果您喜歡這篇文章,請點擊喜歡活逆;如果想及時獲得最新的咨詢拗胜,請點擊關(guān)注。您的支持是對作者都是最大的激勵埂软,萬分感激!By 孫飛