Python 線程與協(xié)程(1)- PyTips 0x12

PyTips

項(xiàng)目地址:https://git.io/pytips

要說到線程(Thread)與協(xié)程(Coroutine)似乎總是需要從并行(Parallelism)與并發(fā)(Concurrency)談起,關(guān)于并行與并發(fā)的問題秒咐,Rob Pike 用 Golang 小地鼠燒書的例子給出了非常生動(dòng)形象的說明拧额。簡單來說并行就是我們現(xiàn)實(shí)世界運(yùn)行的樣子,每個(gè)人都是獨(dú)立的執(zhí)行單元常遂,各自完成自己的任務(wù)纳令,這對應(yīng)著計(jì)算機(jī)中的分布式(多臺(tái)計(jì)算機(jī))或多核(多個(gè)CPU)運(yùn)作模式;而對于并發(fā)克胳,我看到最生動(dòng)的解釋來自Quora 上 Jan Christian Meyer 回答的這張圖

concurrency

并發(fā)對應(yīng)計(jì)算機(jī)中充分利用單核(一個(gè)CPU)實(shí)現(xiàn)(看起來)多個(gè)任務(wù)同時(shí)執(zhí)行泊碑。我們在這里將要討論的 Python 中的線程與協(xié)程僅是基于單核的并發(fā)實(shí)現(xiàn),隨便去網(wǎng)上搜一搜(Thread vs Coroutine)可以找到一大批關(guān)于它們性能的爭論毯欣、benchmark馒过,這次話題的目的不在于討論誰好誰壞,套用一句非常套路的話來說酗钞,拋開應(yīng)用場景爭好壞都是耍流氓腹忽。當(dāng)然在硬件支持的條件下(多核)也可以利用線程和協(xié)程實(shí)現(xiàn)并行計(jì)算来累,而且 Python 2.6 之后新增了標(biāo)準(zhǔn)庫 multiprocessingPEP 371)突破了 GIL 的限制可以充分利用多核,但由于協(xié)程是基于單個(gè)線程的窘奏,因此多進(jìn)程的并行對它們來說情況是類似的嘹锁,因此這里只討論單核并發(fā)的實(shí)現(xiàn)。

要了解線程以及協(xié)程的原理和由來可以查看參考鏈接中的前兩篇文章着裹。Python 3.5 中關(guān)于線程的標(biāo)準(zhǔn)庫是 threading领猾,之前在 2.x 版本中的 thread 在 3.x 之后更名為 _thread ,無論是2.7還是3.5都應(yīng)該盡量避免使用較為底層的 thread/_thread 而應(yīng)該使用 threading骇扇。

創(chuàng)建一個(gè)線程可以通過實(shí)例化一個(gè) threading.Thread 對象:

from threading import Thread
import time

def _sum(x, y):
    print("Compute {} + {}...".format(x, y))
    time.sleep(2.0)
    return x+y
def compute_sum(x, y):
    result = _sum(x, y)
    print("{} + {} = {}".format(x, y, result))

start = time.time()    
threads = [
    Thread(target=compute_sum, args=(0,0)),
    Thread(target=compute_sum, args=(1,1)),
    Thread(target=compute_sum, args=(2,2)),
]
for t in threads:
    t.start()
for t in threads:
    t.join()
print("Total elapsed time {} s".format(time.time() - start))

# Do not use Thread
start = time.time()
compute_sum(0,0)
compute_sum(1,1)
compute_sum(2,2)
print("Total elapsed time {} s".format(time.time() - start))
Compute 0 + 0...
Compute 1 + 1...
Compute 2 + 2...
0 + 0 = 0
1 + 1 = 2
2 + 2 = 4
Total elapsed time 2.002729892730713 s
Compute 0 + 0...
0 + 0 = 0
Compute 1 + 1...
1 + 1 = 2
Compute 2 + 2...
2 + 2 = 4
Total elapsed time 6.004806041717529 s

除了通過將函數(shù)傳遞給 Thread 創(chuàng)建線程實(shí)例之外摔竿,還可以直接繼承 Thread 類:

from threading import Thread
import time
class ComputeSum(Thread):
    def __init__(self, x, y):
        super().__init__()
        self.x = x
        self.y = y
    def run(self):
        result = self._sum(self.x, self.y)
        print("{} + {} = {}".format(self.x, self.y, result))
    def _sum(self, x, y):
        print("Compute {} + {}...".format(x, y))
        time.sleep(2.0)
        return x+y 
threads = [ComputeSum(0,0), ComputeSum(1,1), ComputeSum(2,2)]
start = time.time()
for t in threads:
    t.start()
for t in threads:
    t.join()
print("Total elapsed time {} s".format(time.time() - start))
Compute 0 + 0...
Compute 1 + 1...
Compute 2 + 2...
0 + 0 = 0
1 + 1 = 2
2 + 2 = 4
Total elapsed time 2.001662015914917 s

根據(jù)上面代碼執(zhí)行的結(jié)果可以發(fā)現(xiàn),compute_sum/t.run 函數(shù)的執(zhí)行是按照 start() 的順序少孝,但 _sum 結(jié)果的輸出順序卻是隨機(jī)的继低。因?yàn)?_sum 中加入了 time.sleep(2.0) ,讓程序執(zhí)行到這里就會(huì)進(jìn)入阻塞狀態(tài)稍走,但是幾個(gè)線程的執(zhí)行看起來卻像是同時(shí)進(jìn)行的(并發(fā))袁翁。

有時(shí)候我們既需要并發(fā)地“跳過“阻塞的部分,又需要有序地執(zhí)行其它部分婿脸,例如操作共享數(shù)據(jù)的時(shí)候粱胜,這時(shí)就需要用到”鎖“。在上述”求和線程“的例子中狐树,假設(shè)每次求和都需要加上額外的 _base 并把計(jì)算結(jié)果累積到 _base 中焙压。盡管這個(gè)例子不太恰當(dāng),但它說明了線程鎖的用途:

from threading import Thread, Lock
import time
_base = 1
_lock = Lock()
class ComputeSum(Thread):
    def __init__(self, x, y):
        super().__init__()
        self.x = x
        self.y = y
    def run(self):
        result = self._sum(self.x, self.y)
        print("{} + {} + base = {}".format(self.x, self.y, result))
    def _sum(self, x, y):
        print("Compute {} + {}...".format(x, y))
        time.sleep(2.0)
        global _base
        with _lock:
            result = x + y + _base
            _base = result
        return result
threads = [ComputeSum(0,0), ComputeSum(1,1), ComputeSum(2,2)]

start = time.time()
for t in threads:
    t.start()
for t in threads:
    t.join()
print("Total elapsed time {} s".format(time.time() - start))
Compute 0 + 0...
Compute 1 + 1...
Compute 2 + 2...
0 + 0 + base = 1
1 + 1 + base = 3
2 + 2 + base = 7
Total elapsed time 2.0064051151275635 s

這里用上下文管理器來管理鎖的獲取和釋放褪迟,相當(dāng)于:

_lock.acquire()
try:
    result = x + y + _base
    _base  = result
finally:
    _lock.release()

死鎖

線程的一大問題就是通過加鎖來”搶奪“共享資源的時(shí)候有可能造成死鎖冗恨,例如下面的程序:

from threading import Lock
_base_lock = Lock()
_pos_lock  = Lock()
_base = 1

def _sum(x, y):
    # Time 1
    with _base_lock:
        # Time 3
        with _pos_lock:
            result = x + y
    return result
def _minus(x, y):
    # Time 0
    with _pos_lock:
        # Time 2
        with _base_lock:
            result = x - y
    return result

由于線程的調(diào)度執(zhí)行順序是不確定的,在執(zhí)行上面兩個(gè)線程 _sum/_minus 的時(shí)候就有可能出現(xiàn)注釋中所標(biāo)注的時(shí)間順序味赃,即 # Time 0 的時(shí)候運(yùn)行到 with _pos_lock 獲取了 _pos_lock 鎖掀抹,而接下來由于阻塞馬上切換到了 _sum 中的 # Time 1 ,并獲取了 _base_lock心俗,接下來由于兩個(gè)線程互相鎖定了彼此需要的下一個(gè)鎖傲武,將會(huì)導(dǎo)致死鎖,即程序無法繼續(xù)運(yùn)行城榛。根據(jù) 我是一個(gè)線程 中所描述的揪利,為了避免死鎖,需要所有的線程按照指定的算法(或優(yōu)先級)來進(jìn)行加鎖操作狠持。不管怎么說疟位,死鎖問題都是一件非常傷腦筋的事,原因之一在于不管線程實(shí)現(xiàn)的是并發(fā)還是并行喘垂,在編程模型和語法上看起來都是并行的甜刻,而我們的大腦雖然是一個(gè)(內(nèi)隱的)絕對并行加工的機(jī)器绍撞,卻非常不善于將并行過程具象化(至少在未經(jīng)足夠訓(xùn)練的時(shí)候)。而與線程相比得院,協(xié)程(尤其是結(jié)合事件循環(huán))無論在編程模型還是語法上傻铣,看起來都是非常友好的單線程同步過程。后面第二部分我們再來討論 Python 中協(xié)程是如何從”小三“一步步扶正上位的:D祥绞。

歡迎關(guān)注公眾號 PyHub非洲!

參考

  1. Python 中的進(jìn)程、線程蜕径、協(xié)程两踏、同步、異步丧荐、回調(diào)
  2. 我是一個(gè)線程
  3. Concurrency is not Parallelism
  4. A Curious Course on Coroutines and Concurrency
  5. PyDocs: 17.1. threading — Thread-based parallelism
  6. PyDocs: 18.5.3. Tasks and coroutines
  7. [譯] Python 3.5 協(xié)程究竟是個(gè)啥
  8. 協(xié)程的好處是什么缆瓣? - crazybie 的回答
  9. Py3-cookbook:第十二章:并發(fā)編程
  10. Quora: What are the differences between parallel, concurrent and asynchronous programming?
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末喧枷,一起剝皮案震驚了整個(gè)濱河市虹统,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌隧甚,老刑警劉巖车荔,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異戚扳,居然都是意外死亡忧便,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進(jìn)店門帽借,熙熙樓的掌柜王于貴愁眉苦臉地迎上來珠增,“玉大人,你說我怎么就攤上這事砍艾〉俳蹋” “怎么了?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵脆荷,是天一觀的道長凝垛。 經(jīng)常有香客問我,道長蜓谋,這世上最難降的妖魔是什么梦皮? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮桃焕,結(jié)果婚禮上剑肯,老公的妹妹穿的比我還像新娘。我一直安慰自己观堂,他們只是感情好让网,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布岖妄。 她就那樣靜靜地躺著,像睡著了一般寂祥。 火紅的嫁衣襯著肌膚如雪荐虐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天丸凭,我揣著相機(jī)與錄音福扬,去河邊找鬼。 笑死惜犀,一個(gè)胖子當(dāng)著我的面吹牛铛碑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播虽界,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼汽烦,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了莉御?” 一聲冷哼從身側(cè)響起撇吞,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎礁叔,沒想到半個(gè)月后牍颈,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡琅关,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年煮岁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涣易。...
    茶點(diǎn)故事閱讀 40,110評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡画机,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出新症,到底是詐尸還是另有隱情步氏,我是刑警寧澤,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布账劲,位于F島的核電站戳护,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏瀑焦。R本人自食惡果不足惜腌且,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望榛瓮。 院中可真熱鬧铺董,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至重付,卻和暖如春顷级,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背确垫。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工弓颈, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像围段,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子恃慧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評論 2 355

推薦閱讀更多精彩內(nèi)容