記一次線上多線程同步數(shù)據(jù)的問題

事情經(jīng)過

由于公司需要進(jìn)行公眾號遷移忙芒,需要對線上的openId進(jìn)行清洗,由于數(shù)據(jù)量巨大供屉,并且依賴了微信的外部接口行冰,所以決定用多線程進(jìn)行處理。
代碼如下:

val exec = {
      new ThreadPoolExecutor(20, 20, 0L, TimeUnit.MILLISECONDS,
        new LinkedBlockingQueue[Runnable](100),
        new ThreadPoolExecutor.CallerRunsPolicy()
      )
    }
    MemberDataSource.mysqlData.withConnection(conn => {
      val stmt = conn.createStatement(java.sql.ResultSet.TYPE_FORWARD_ONLY, java.sql.ResultSet.CONCUR_READ_ONLY)
      stmt.setFetchSize(Integer.MIN_VALUE)
      //and id>2107380
      val rs = stmt.executeQuery("select * from test where status=0 ")
      val arrayBuffer = new ArrayBuffer[String](100)
      while (rs.next()) {
         val row = ResultSetMapper.material[MemberChannelList].from(rs)
         arrayBuffer += row.openId
         if (arrayBuffer.length == 100) {
          exec.execute(()=> logger.info(s"${arrayBuffer.toList}"))
          arrayBuffer.clear

         }
      }
    })

主要思路為:模仿去年切非瑪時(shí)的方法伶丐,使用數(shù)據(jù)庫游標(biāo)將數(shù)據(jù)查出悼做,封裝一個(gè)長度為100的數(shù)組,然后使用多線程對微信進(jìn)行請求獲取結(jié)果撵割。

但是在測試的時(shí)候發(fā)現(xiàn)贿堰,每個(gè)線程請求的數(shù)據(jù)發(fā)生了錯(cuò)亂,每個(gè)線程請求的數(shù)據(jù)有重復(fù)啡彬,這樣造成了數(shù)據(jù)的重復(fù)操作,于是立刻停止故硅。

image.png

例如:線程11和線程12請求的數(shù)據(jù)有相同的庶灿,于是懷疑是多線程導(dǎo)致的線程錯(cuò)亂的問題。
于是將問題原因鎖定在arrayBuffer上吃衅,認(rèn)為它不是線程安全的往踢,所以導(dǎo)致了線程請求的數(shù)據(jù)出現(xiàn)重復(fù),于是決定改成ConcurrentLinkList徘层,但是依然請求的結(jié)果如此峻呕,折騰了一晚上,不管怎么修改趣效,依然線程之間有重復(fù)數(shù)據(jù)瘦癌,跟孫政兩人修改代碼到天明,依然沒有找到問題跷敬,兩個(gè)人都準(zhǔn)備放棄了讯私,決定就單線程的跑完算了,慢點(diǎn)就慢點(diǎn)西傀,在早上準(zhǔn)備放棄的時(shí)候斤寇,抱著最后一絲希望,請教遠(yuǎn)在深圳的祥哥拥褂,祥哥快速定位問題娘锁,并且寫出了正確的代碼

if(arrayBuffer.length == 99) {

 val asList = arrayBuffer.toList
 exec.execute ( openIdInsertMethod(asList) )

 arrayBuffer.clear
}

一開始拿到代碼,因?yàn)橐呀?jīng)一晚上沒睡饺鹃,還沒明白到底跟自己的有什么不同莫秆,只是盲目的粘貼上去间雀,但是神奇的發(fā)現(xiàn)問題解決了,請求的參數(shù)里面再?zèng)]出現(xiàn)之前的線程錯(cuò)亂問題


image.png

當(dāng)時(shí)感覺特別不可思議馏锡,立刻比對之前的代碼
發(fā)現(xiàn)代碼唯一的不同在于

 修改前:
 exec.execute ( openIdInsertMethod(arrayBuffer.toList) )

 修改后:
 val asList = arrayBuffer.toList
 exec.execute ( openIdInsertMethod(asList) )



一個(gè)是在線程池里面toList雷蹂,一個(gè)是在外面定義一個(gè)變量去toList
終于明白原因:
在一個(gè)線程中開啟另外一個(gè)新線程,則新開線程稱為該線程的子線程杯道,子線程初始優(yōu)先級與父線程相同匪煌。不過主線程先啟動(dòng)占用了cpu資源,因此主線程總是優(yōu)于子線程党巾。然而萎庭,其實(shí)設(shè)置了優(yōu)先級,也無法保障線程的執(zhí)行次序齿拂。只不過驳规,優(yōu)先級高的線程獲取CPU資源的概率較大,優(yōu)先級低的并非沒機(jī)會(huì)執(zhí)行署海。

所以arrayBuffer.clear有可能先執(zhí)行吗购,那么exec.execute執(zhí)行的arrayBuffer就是一個(gè)空的數(shù)組,所以就出現(xiàn)了多個(gè)線程出現(xiàn)了重復(fù)數(shù)據(jù)的原因砸狞,所以我們要保證的是exec.execute每次執(zhí)行完arrayBuffer后再進(jìn)行clear即可捻勉。而不是一開始定位的保證arrayBuffer的安全性。所以將toList操作放在外面去執(zhí)行后刀森,多線程數(shù)據(jù)就正常了踱启。

在此感謝遠(yuǎn)在深圳的祥哥,立刻定位到問題研底,不然我們這次數(shù)據(jù)清洗可能真的要跑30多個(gè)小時(shí)埠偿。 再次感謝??????

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市榜晦,隨后出現(xiàn)的幾起案子冠蒋,更是在濱河造成了極大的恐慌,老刑警劉巖芽隆,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件浊服,死亡現(xiàn)場離奇詭異,居然都是意外死亡胚吁,警方通過查閱死者的電腦和手機(jī)牙躺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來腕扶,“玉大人孽拷,你說我怎么就攤上這事“氡В” “怎么了脓恕?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵膜宋,是天一觀的道長。 經(jīng)常有香客問我炼幔,道長秋茫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任乃秀,我火速辦了婚禮肛著,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘跺讯。我一直安慰自己枢贿,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布刀脏。 她就那樣靜靜地躺著局荚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪愈污。 梳的紋絲不亂的頭發(fā)上耀态,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天,我揣著相機(jī)與錄音暂雹,去河邊找鬼茫陆。 笑死,一個(gè)胖子當(dāng)著我的面吹牛擎析,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播挥下,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼揍魂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了棚瘟?” 一聲冷哼從身側(cè)響起现斋,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎偎蘸,沒想到半個(gè)月后庄蹋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡迷雪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年限书,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片章咧。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡倦西,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出赁严,到底是詐尸還是另有隱情扰柠,我是刑警寧澤粉铐,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站卤档,受9級特大地震影響蝙泼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜劝枣,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一汤踏、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧哨免,春花似錦茎活、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至采桃,卻和暖如春懒熙,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背普办。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工工扎, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人衔蹲。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓肢娘,卻偏偏與公主長得像,于是被迫代替她去往敵國和親舆驶。 傳聞我的和親對象是個(gè)殘疾皇子橱健,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 多線程主線程與子線程執(zhí)行順序問題 案發(fā)現(xiàn)場 上述代碼目標(biāo)是完成在庫600w微信公眾號會(huì)員數(shù)據(jù)的清洗,通過jdbc游...
    sunz_22c4閱讀 143評論 0 0
  • 林炳文Evankaka原創(chuàng)作品沙廉。轉(zhuǎn)載自http://blog.csdn.net/evankaka 本文主要講了ja...
    ccq_inori閱讀 647評論 0 4
  • Java-Review-Note——4.多線程 標(biāo)簽: JavaStudy PS:本來是分開三篇的拘荡,后來想想還是整...
    coder_pig閱讀 1,639評論 2 17
  • 寫在前面的話: 這篇博客是我從這里“轉(zhuǎn)載”的,為什么轉(zhuǎn)載兩個(gè)字加“”呢撬陵?因?yàn)檫@絕不是簡單的復(fù)制粘貼珊皿,我花了五六個(gè)小...
    SmartSean閱讀 4,715評論 12 45
  • 本文主要講了java中多線程的使用方法、線程同步巨税、線程數(shù)據(jù)傳遞蟋定、線程狀態(tài)及相應(yīng)的一些線程函數(shù)用法、概述等垢夹。 首先講...
    李欣陽閱讀 2,444評論 1 15