現(xiàn)代軟件系統(tǒng)中,除了進(jìn)程之外 線程也是一個(gè)十分重要的概念 特別是隨著CPU頻率增長(zhǎng)開始出現(xiàn)停滯,而開始向多核方向發(fā)展。多線程 作為實(shí)現(xiàn)軟件并發(fā)執(zhí)行的一個(gè)重要方法 也開始具有越來(lái)越重要的地位。下面讓我們來(lái)認(rèn)識(shí)什么是線程吧确垫。
什么是線程
線程(Thread)弓颈,有時(shí)被稱為輕量級(jí)進(jìn)程(Lightweight Progress,LWP),是程序執(zhí)行流的最小單元。一個(gè)標(biāo)準(zhǔn)的線程由線程ID 删掀、當(dāng)前指令指針(PC)翔冀、寄存器集合和堆棧組成。通常意義上爬迟,一個(gè)進(jìn)程由一個(gè)到多個(gè)線程組成橘蜜,各個(gè)線程之間共享程序的內(nèi)存空間(包括代碼段、數(shù)據(jù)段付呕、堆棧等)及一些進(jìn)程級(jí)的資源(如打開文件和信號(hào))计福。一個(gè)金典的線程與進(jìn)程的關(guān)系如下圖:
大多數(shù)軟件應(yīng)用中 線程的數(shù)量都不止一個(gè),多線程可以互不干擾地并發(fā)執(zhí)行徽职,并共享進(jìn)程的全局變量和堆的數(shù)據(jù)象颖。那么多個(gè)線程與單線程的進(jìn)程相比具有很大的優(yōu)勢(shì)。
通常使用多線程原因有如下幾點(diǎn):某個(gè)線程可能會(huì)陷入長(zhǎng)時(shí)間等待 等待的線程會(huì)進(jìn)入睡眠狀態(tài) 無(wú)法繼續(xù)執(zhí)行姆钉。多線程可以有效利用等待時(shí)間说订。典型例子是等待網(wǎng)絡(luò)響應(yīng),這可能花費(fèi)數(shù)秒甚至數(shù)十秒潮瓶。
某個(gè)操作會(huì)消耗大量的時(shí)間陶冷,如果只有一個(gè)線程 程序和用戶之間的交互會(huì)中斷 多線程會(huì)讓一個(gè)線程負(fù)責(zé)交互另一個(gè)線程負(fù)責(zé)計(jì)算。
程序邏輯本身就要求并發(fā)操作 例如一個(gè)多端下載軟件毯辅。
多CPU或多核計(jì)算機(jī)本身具備同時(shí)執(zhí)行多個(gè)線程的能力 因此單線程程序無(wú)法全面發(fā)揮計(jì)算機(jī)的全部計(jì)算能力 相對(duì)于多進(jìn)程應(yīng)用 多線程在數(shù)據(jù)共享方面效率要高很多埂伦。
線程的訪問(wèn)權(quán)限
線程的訪問(wèn)非常自由 它可以訪問(wèn)進(jìn)程內(nèi)存里的所有數(shù)據(jù) 甚至包括其他線程的堆棧(如果它知道其他線程的堆棧地址),單實(shí)際運(yùn)用中線程也擁有自己的私有存儲(chǔ)空間包括以下幾個(gè)方面思恐。
棧(盡管并非完全無(wú)法被其他線程訪問(wèn) 但一般情況下仍然可以認(rèn)為是私有的數(shù)據(jù))沾谜。
線程局部存儲(chǔ)(Thread Local Storage,TLS),線程局部存儲(chǔ)是某些操作系統(tǒng)為線程單獨(dú)提供的私有空間 但通常只具有很有限的容量。
寄存器(包括PC寄存器)胀莹,寄存器是執(zhí)行流的基本數(shù)據(jù) 因此為線程私有基跑。
線程的優(yōu)先級(jí)與調(diào)度
不論是在多處理器的計(jì)算機(jī)上海市在單處理器的計(jì)算機(jī)上 線程總是“并發(fā)”執(zhí)行的 當(dāng)線程數(shù)量小于等于處理器數(shù)量時(shí)(并且操作系統(tǒng)支持多處理器) 線程的并發(fā)是真正的并發(fā) 不同的線程運(yùn)行在不同的處理器上彼此之間互不相干 但對(duì)于線程數(shù)量大于處理器數(shù)量的情況 線程的并發(fā)會(huì)受到一些阻礙 因?yàn)榇藭r(shí)至少有一個(gè)處理器會(huì)運(yùn)行多個(gè)線程。
在單處理器對(duì)應(yīng)多線程的情況下 并發(fā)是一種模擬出來(lái)的狀態(tài)描焰。 操作系統(tǒng)會(huì)讓這些多線程程序輪流執(zhí)行 每次僅執(zhí)行一小段時(shí)間(通常是幾十到幾百毫秒)媳否,這樣每個(gè)線程就“看起來(lái)”在同時(shí)執(zhí)行。這樣的一個(gè)不斷在處理器切換不同的線程的行為稱為線程的調(diào)度(Thread Schedule)荆秦。
在線程調(diào)度中 線程通常擁有至少三種狀態(tài) 分別是:?
運(yùn)行(Running):此時(shí)線程正在執(zhí)行
就緒(Ready): 此時(shí)線程可以立刻運(yùn)行但CPU 已經(jīng)被占用
等待(Waiting): 此時(shí)線程正在等待某-事件(通常是I/O 或同步)發(fā)生 無(wú)法執(zhí)行
處于運(yùn)行中線程擁有一段可以執(zhí)行的時(shí)間 這段時(shí)間稱之為 時(shí)間片(Time Slice),當(dāng)時(shí)間片用盡的時(shí)候 該進(jìn)程進(jìn)入就緒狀態(tài) 如果在時(shí)間片用盡之前程序就開始等待某事件 那么它將進(jìn)入等待狀態(tài) 每當(dāng)一個(gè)線程離開運(yùn)行狀態(tài)時(shí) 調(diào)度系統(tǒng)就會(huì)選擇一個(gè)其他的就緒線程繼續(xù)執(zhí)行 在一個(gè)處于等待狀態(tài)的線程所等待事件發(fā)生之后 該線程就進(jìn)入就緒狀態(tài) 逆日。
線程狀態(tài)切換
線程調(diào)度自多任務(wù)操作系統(tǒng)問(wèn)世以來(lái)就不斷的被提出不同的方案和算法 現(xiàn)在主流的調(diào)度方式盡管各不相同 但都帶有優(yōu)先級(jí)調(diào)度(Priority Schedule) 和輪轉(zhuǎn)法(Round Robin)的痕跡。所謂輪轉(zhuǎn)法即是之前提到的讓各個(gè)線程之間輪流執(zhí)行一小段時(shí)間的方法萄凤。這決定了線程之間交錯(cuò)執(zhí)行的特點(diǎn)。而優(yōu)先級(jí)調(diào)度則決定了線程按照什么順序輪流執(zhí)行搪哪。在具有優(yōu)先級(jí)調(diào)度的系統(tǒng)中 線程都擁有各自的線程優(yōu)先級(jí)(Thread Priority)靡努。具有高優(yōu)先級(jí)的線程會(huì)更早執(zhí)行 而低優(yōu)先級(jí)線程往往要等待系統(tǒng)中已經(jīng)沒(méi)有高優(yōu)先級(jí)的可執(zhí)行的線程存在時(shí)再能執(zhí)行。
線程的優(yōu)先級(jí)不近可以由用戶手動(dòng)設(shè)置 系統(tǒng)還會(huì)根據(jù)不同線程的表現(xiàn)自動(dòng)調(diào)整優(yōu)先級(jí),以使調(diào)度更有效率惑朦。例如通常情況下 頻繁進(jìn)入等待狀態(tài)(進(jìn)入等待狀態(tài) 會(huì)放棄之后仍然可占用的時(shí)間份額)的線程(例如I/O的線程)比頻繁進(jìn)行大量計(jì)算 以至于每次都要把時(shí)間片全部用盡的線程要受歡迎的多兽泄。其實(shí)道理很簡(jiǎn)單 頻繁等待的線程通常只占用很少的時(shí)間 CPU也喜歡先捏軟柿子。我們把一段頻繁等待的線程稱為IO密集型線程(IO Bound Thread),而把很少等待的線程稱為CPU密集型線程(CPU Bound Thread). IO密集型線程總是比CPU密集型線程容易得到優(yōu)先級(jí)的提升漾月。
在優(yōu)先級(jí)調(diào)度下 存在一種餓死(Starvation)的現(xiàn)象 一個(gè)線程被餓死是說(shuō)它的優(yōu)先級(jí)比較低 在它執(zhí)行之前 總是有較高優(yōu)先級(jí)的線程視圖執(zhí)行 因此這個(gè)低優(yōu)先級(jí)線程始終無(wú)法執(zhí)行病梢。所以為了避免餓死現(xiàn)象 調(diào)度系統(tǒng)常常會(huì)逐步提升那些等待了過(guò)長(zhǎng)時(shí)間得不到執(zhí)行的線程優(yōu)先級(jí)。在這樣的手段下 一個(gè)線程只要等待時(shí)間足夠長(zhǎng) 其優(yōu)先級(jí)一定會(huì)提高到足夠讓它執(zhí)行的程度梁肿。
在優(yōu)先級(jí)調(diào)度的環(huán)境下 線程優(yōu)先級(jí)改變一般有三種方式蜓陌。
用戶指定優(yōu)先級(jí) 根據(jù)進(jìn)入等待狀態(tài)的頻繁程度提升或降低優(yōu)先級(jí) 長(zhǎng)時(shí)間得不到執(zhí)行而被提升優(yōu)先級(jí)?