Tornado 文件下載Hash值不同 (閱讀tornado源碼記錄)

版本信息

python3.7
tornado==4.3.0

問題描述: 多次下載同樣的文件浦旱,每次文件的hash均不相同.

下載文件的示例接口:

import tornado
from tornado.concurrent import futures
from tornado.concurrent import run_on_executor
from tornado.web import RequestHandler

@run_on_executor
@tornado.web.asynchronous
class XXX_Handler(RequestHandler):
    executor = futures.ThreadPoolExecutor()

    def get():
        data = open("/data/xxx.csv",encoding="utf-8")
        chunk = data.read(65536)
        while chunk:
            self.write(chunk)
            self.flush()
            chunk = data.read(65536)
        data.close()
        self.set_status(200)
        return self.finish()        

推測(cè)可能與線程池有關(guān),果真去掉@run_on_executor則正常.
好奇心驅(qū)使進(jìn)行具體原因調(diào)查,后面涉及到Tornado相關(guān)源碼的查看與記錄露该。

  1. 通過RequestHandlerflush方法 檢查到self.stream.write 中的 data每次的hash都是相同译暂,繼續(xù)向下調(diào)查。
        else:
            if callback is not None:
                self._write_callback = stack_context.wrap(callback)
            else:
                future = self._write_future = Future()
            data = b"\r\n".join(lines) + b"\r\n\r\n"
            if chunk:
                data += self._format_chunk(chunk)
            self._pending_write = self.stream.write(data)
            self._pending_write.add_done_callback(self._on_write_complete)
        return future
  1. 查看self.stream如何產(chǎn)生的, 這里就看到TCP server的class蔫耽,來監(jiān)聽socket連接的請(qǐng)求结耀,使用sock的文件描述記錄下載, 分配一個(gè)handler來處理, 添加一個(gè)讀事件(事件都是主線程來處理), 然后獲取connection連接, 實(shí)例化IOStream 來處理消息的接收和響應(yīng)
                stream = IOStream(connection, io_loop=self.io_loop,
                                  max_buffer_size=self.max_buffer_size,
                                  read_chunk_size=self.read_chunk_size)
            future = self.handle_stream(stream, address)
            if future is not None:
                self.io_loop.add_future(future, lambda f: f.result())
        except Exception:
            app_log.error("Error in connection callback", exc_info=True)

3.知道通過IOstream來傳送數(shù)據(jù)匙铡,查看它的write方法.主要就是按照大小將上層傳過來的數(shù)據(jù)切分到指定大小图甜,
(1).通過self._handle_write來發(fā)送 self._write_buffer保存的chunk數(shù)據(jù)

        if not self._connecting:
            self._handle_write()
            if self._write_buffer:
                self._add_io_state(self.io_loop.WRITE)
            self._maybe_add_error_listener()
        return future

(2). 查看self._handle_write, self._handle_write是ThreadPoolExecutor的線程池來處理的,發(fā)生(Resource temporarily unavailable)錯(cuò)誤失敗, 會(huì)返回到上面的函數(shù)中添加寫事件來處理(主線程) self._add_io_state(self.io_loop.WRITE)鳖眼。
如果發(fā)送錯(cuò)誤比較多黑毅,這就導(dǎo)致出現(xiàn)多線程都在寫self._write_buffer的問題, 會(huì)出現(xiàn)順序錯(cuò)誤或者重復(fù)數(shù)據(jù)的問題從而導(dǎo)致hash結(jié)果不同。

            except (socket.error, IOError, OSError) as e:
                if e.args[0] in _ERRNO_WOULDBLOCK:
                    self._write_buffer_frozen = True
                    break
                else:
                    if not self._is_connreset(e):
                        # Broken pipe errors are usually caused by connection
                        # reset, and its better to not log EPIPE errors to
                        # minimize log spam
                        gen_log.warning("Write error on %s: %s",
                                        self.fileno(), e)
                    self.close(exc_info=True)
                    return

測(cè)試使用硬核的方法钦讳,失敗后去除掉 主線程重試的寫事件矿瘦,而是交給當(dāng)前線程一直重試。蜂厅。匪凡。這個(gè)測(cè)試可以獲得正確的hash,不過最好是去掉@run_on_executor的使用.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末掘猿,一起剝皮案震驚了整個(gè)濱河市病游,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖衬衬,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件买猖,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡滋尉,警方通過查閱死者的電腦和手機(jī)玉控,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來狮惜,“玉大人高诺,你說我怎么就攤上這事∧氪郏” “怎么了虱而?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)开泽。 經(jīng)常有香客問我牡拇,道長(zhǎng),這世上最難降的妖魔是什么穆律? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任惠呼,我火速辦了婚禮,結(jié)果婚禮上峦耘,老公的妹妹穿的比我還像新娘剔蹋。我一直安慰自己,他們只是感情好贡歧,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布滩租。 她就那樣靜靜地躺著,像睡著了一般利朵。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上猎莲,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天绍弟,我揣著相機(jī)與錄音,去河邊找鬼著洼。 笑死樟遣,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的身笤。 我是一名探鬼主播豹悬,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼液荸!你這毒婦竟也來了瞻佛?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎伤柄,沒想到半個(gè)月后绊困,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡适刀,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年秤朗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片笔喉。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡取视,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出常挚,到底是詐尸還是另有隱情作谭,我是刑警寧澤,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布待侵,位于F島的核電站丢早,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏秧倾。R本人自食惡果不足惜怨酝,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望那先。 院中可真熱鬧农猬,春花似錦、人聲如沸售淡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽揖闸。三九已至揍堕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間汤纸,已是汗流浹背衩茸。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留贮泞,地道東北人楞慈。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像啃擦,于是被迫代替她去往敵國(guó)和親囊蓝。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 原創(chuàng)文章出自公眾號(hào):「碼農(nóng)富哥」令蛉,如需轉(zhuǎn)載請(qǐng)請(qǐng)注明出處聚霜!文章如果對(duì)你有收獲,可以收藏轉(zhuǎn)發(fā),這會(huì)給我一個(gè)大大鼓勵(lì)喲俯萎!...
    大富帥閱讀 12,266評(píng)論 5 16
  • Tornado 是由 Facebook 開源的一個(gè)服務(wù)器“套裝”傲宜,適合于做 python 的 web 或者使用其本...
    AntaresDoctor閱讀 543評(píng)論 0 1
  • tornado 是一個(gè) python web 框架和異步網(wǎng)絡(luò)庫,使用 IO 事件循環(huán)分析版本為:v3.0.0 夫啊,先...
    yeqy閱讀 325評(píng)論 0 0
  • 簡(jiǎn)介 Tornado龍卷風(fēng)是一個(gè)開源的網(wǎng)絡(luò)服務(wù)器框架函卒,它是基于社交聚合網(wǎng)站FriendFeed的實(shí)時(shí)信息服務(wù)開發(fā)而...
    JunChow520閱讀 54,031評(píng)論 4 46
  • 參考資料 http://c.biancheng.net/view/2125.html TCP TCP協(xié)議是一個(gè)面向...
    JunChow520閱讀 1,450評(píng)論 0 5