說明:該系列博客整理自《算法導(dǎo)論(原書第二版)》埋哟,但更偏重于實(shí)用臀叙,所以晦澀偏理論的內(nèi)容未整理略水,請(qǐng)見諒。另外本人能力有限劝萤,如有問題渊涝,懇請(qǐng)指正!
? ? 在一個(gè)由n個(gè)元素組成的集合中床嫌,第i個(gè)順序統(tǒng)計(jì)量是該集合中第i小的元素跨释。例如,在一組元素所組成的集合中厌处,?最小值?是第 1 個(gè)順序統(tǒng)計(jì)量(?i?= 1 )鳖谈,?最大值?是第?n?個(gè)順序統(tǒng)計(jì)量(?i?=?n)。而?中位數(shù)?(median)是它所在集合的“中點(diǎn)元素”阔涉。當(dāng)n為奇數(shù)時(shí)缆娃,中位數(shù)是唯一的,出現(xiàn)在i = (n+1)/2處瑰排。當(dāng)n為偶數(shù)時(shí)存在兩個(gè)中位數(shù)贯要,分別出現(xiàn)在i = n/2和i = n/2+1處,因此椭住,不考慮奇偶性崇渗,中位數(shù)總是出現(xiàn)在(n+1)/2向下取整(下中位數(shù))和(n+1)/2向上取整處(上中位數(shù))。
????從一個(gè)由?n?個(gè)數(shù)值構(gòu)成的集合(下面的講解假設(shè)集合中的數(shù)互異,但實(shí)際上所有處理都可以推廣到集合中包含重復(fù)數(shù)值的情況)中選擇其第?i?個(gè)順序統(tǒng)計(jì)量的問題显押,可以形式化地定義為?選擇問題?(selection problem):
? ??????????輸入:?一個(gè)包含?n?個(gè)(不同的)數(shù)的集合?A?和一個(gè)數(shù)?i?扳肛,1 <=?i?<=?n?。
? ??????????輸出:?元素?x?∈?A?乘碑,它恰好大于?A?中其他的?i?- 1個(gè)元素挖息。
1、最大值和最小值==特殊選擇問題
? ? 在一個(gè)有n個(gè)元素的集合中兽肤,要做多少次比較才能確定其最小元素呢套腹?可以很容易的給出n-1次比較這個(gè)上界:依次查看集合中的每個(gè)元素,并記錄比較過程中的最小元素资铡。這是最小值算法最好的結(jié)果电禀。
MINIMUM(A)
1 min = A[1]
2 for i = 2 to A.length
3? ? if min > A[i]
4? ? ? ? min = A[i]
5 return min
? ? 最大值算法同理最小值算法。
MAXIMUM(A)
1 max = A[1]
2 for i = 2 to A.length
3? ? if max < A[i]
4? ? ? ? max = A[i]
5 reutrn max
????要設(shè)計(jì)出一個(gè)算法笤休,使之通過漸近最優(yōu)的Θ(n)次比較尖飞,就能從n個(gè)元素中找出最小值和最大值,做到這一點(diǎn)并不困難店雅,只要獨(dú)立的找出最大值和最小值政基,各用n-1次比較,共有2n-2次比較闹啦。
? ? 事實(shí)上沮明,至多?3?n/2?次比較就足以同時(shí)找到最大值和最小值。做法是記錄比較過程中遇到的最大值和最小值窍奋。我們并不是將每一個(gè)輸入元素與當(dāng)前的最大值和最小值進(jìn)行比較荐健,而是成對(duì)的處理元素。先將一對(duì)輸入元素互相比較琳袄,然后將較小者和當(dāng)前最小值比較江场,較大者和當(dāng)前最大值比較,因此每兩個(gè)元素需要三次比較挚歧。
? ? 如何設(shè)定當(dāng)前最小值和最大值的初始值依賴于n是奇數(shù)還是偶數(shù)扛稽。如果n是奇數(shù),就將最小值和最大值都設(shè)為第一個(gè)元素的值滑负,然后成對(duì)的處理余下的元素在张。如果n是偶數(shù),就對(duì)前兩個(gè)元素做一次比較矮慕,以決定最小值和最大值的初值帮匾,然后成對(duì)的處理余下的元素。
2痴鳄、一般選擇問題
????一般選擇問題瘟斜,即返回?cái)?shù)組A[p..r]中第i小的元素,看起來要比找最小值的簡單選擇問題更難,但兩種問題的漸近運(yùn)行時(shí)間卻是相同的:都是?Θ?(?n?)螺句。這里介紹一種解決選擇問題的分治算法虽惭,即?RANDOMIZED-SELECT?算法。該算法以之前第7章介紹的快速排序算法為基礎(chǔ)蛇尚。如同在排序算法中一樣芽唇,此算法的思想也是對(duì)輸入數(shù)組進(jìn)行遞歸劃分,但和快速排序不同的是取劫,快速排序會(huì)遞歸處理劃分的兩邊匆笤,而RANDOMIZED-SELECT?算法只處理劃分的一邊。
? ? RANDOMIZED-SELECT?算法利用了快速排序算法的RANDOMIZED-PARTITION程序谱邪,所以RANDOMIZED-SELECT?算法也是一個(gè)隨機(jī)算法炮捧。
RANDOMIZED-SELECT(A, p, r, i)
1? if p == r
2? ? ? return A[p]
3? q = RANDOMIZED-PARTITION(A, p, r)
4? k = q - p + 1//計(jì)算數(shù)組A[p..q]內(nèi)元素的個(gè)數(shù)k,即處于劃分低區(qū)的元素的個(gè)數(shù)加上一個(gè)主元元素
5? if i == k? ? // the pivot value is the answer
6? ? ? return A[k]
7? elseif i < k
8? ? ? return RANDOMIZED-SELECT(A, p, q - 1, i)
9? else
10? ? return RANDOMIZED-SELECT(A, q + 1, r, i - k)
? ? 該隨機(jī)選擇算法的最壞情況運(yùn)行時(shí)間為?Θ?(?n2?)惦银,但是由于采用了RANDOMIZED-PARTITION程序咆课,所以非常小概率會(huì)出現(xiàn)最壞情況。