Go 語言并發(fā)清洗數(shù)據(jù)

某徒弟每日工作就是把數(shù)據(jù)庫里上十萬條數(shù)據(jù)取出來進行一些操作(更新字段救赐、檢查鏈接狀態(tài)等),把 Go 當 PHP 寫,一個 for 循環(huán)怯屉,一兩個小時過去了才能出結(jié)果(可能他就是想這么摸魚吧)易阳。他說并發(fā)編程容易寫錯附较,需求又急:),幸好我之前寫過一點潦俺,整一個 demo 給他參考一下拒课。

WaitGroup 和 數(shù)據(jù)庫分頁

package main

import (
    "fmt"
    "sync"
    "time"
)

func main() {
    start := time.Now()
    var wg sync.WaitGroup
    // 總條數(shù)徐勃,一般從數(shù)據(jù)庫 COUNT 出來
    count := 8823
    // 每頁處理的條數(shù)
    pageSize := 1000
    // 總頁數(shù) 向上取整
    page := (count + pageSize - 1) / pageSize

    // 每頁開一個 goroutine
    for i := 0; i < page; i++ {
        wg.Add(1)
        go func(i int) {
            defer wg.Done()
            // 計算當前頁的偏移量
            offset := i * pageSize
            // demo 拼接 Sql 然后 按ID順序 查出數(shù)據(jù)遍歷處理 記錄日志方便知道清洗的位置
            fmt.Println("sql 里的 limit ", offset, ",", pageSize)
        }(i)
    }
    wg.Wait()

    end := time.Since(start)
    fmt.Println("總共花了", end)
}

數(shù)據(jù)量更大,不能直接載入機器內(nèi)存

package main

import (
    "fmt"
    "sync"
    "time"
)

func main() {
    start := time.Now()

    // 大量數(shù)據(jù)一次開多個 goroutine 全部取出數(shù)據(jù)放到機器內(nèi)存里早像,數(shù)據(jù)庫和內(nèi)存都可能會崩
    // 采用同步加異步的方式處理
    // 外部循環(huán)同步僻肖,處理完再開始下一輪 內(nèi)部循環(huán)并發(fā)執(zhí)行
    // 總條數(shù)
    count := 121231
    // 外部循環(huán)每次處理的條數(shù),考慮機器內(nèi)存可以適當調(diào)整
    pageOutSize := 10000
    // 外部循環(huán)次數(shù)
    pageOut := (count + pageOutSize - 1) / pageOutSize

    for i := 0; i < pageOut; i++ {
        // 內(nèi)循環(huán)
        var wg sync.WaitGroup
        // 內(nèi)循環(huán)每頁處理的條數(shù)
        pageInnerSize := 1000
        // 內(nèi)部循環(huán)需要處理的總條數(shù)
        innerCount := pageOutSize
        if i == pageOut-1 {
            // 最后一頁了 只需要處理剩下的條數(shù)即可
            innerCount = count - pageOutSize*(pageOut-1)
        }
        // 內(nèi)循環(huán)的總頁數(shù)卢鹦,每頁開啟一個 goroutine
        pageInner := (innerCount + pageInnerSize - 1) / pageInnerSize
        for j := 0; j < pageInner; j++ {
            wg.Add(1)
            go func(j int) {
                defer wg.Done()
                // 計算偏移量臀脏,需要考慮外部循環(huán)的輪次
                offset := i*pageOutSize + j*pageInnerSize
                // demo 拼接 Sql 然后 按ID順序 查出數(shù)據(jù)遍歷處理 記錄日志方便知道清洗的位置
                fmt.Println("sql 里的 limit ", offset, ",", pageInnerSize)
            }(j)
        }
        wg.Wait()
    }

    end := time.Since(start)
    fmt.Println("總共花了", end)
}

如果遇到錯誤需要終止執(zhí)行,可以考慮將 WaitGroup 換成 errgroup冀自,看具體需求揉稚。不足之處歡迎留言指正:)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市熬粗,隨后出現(xiàn)的幾起案子窃植,更是在濱河造成了極大的恐慌,老刑警劉巖荐糜,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件巷怜,死亡現(xiàn)場離奇詭異,居然都是意外死亡暴氏,警方通過查閱死者的電腦和手機延塑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來答渔,“玉大人关带,你說我怎么就攤上這事≌铀海” “怎么了宋雏?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長务豺。 經(jīng)常有香客問我磨总,道長,這世上最難降的妖魔是什么笼沥? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任蚪燕,我火速辦了婚禮,結(jié)果婚禮上奔浅,老公的妹妹穿的比我還像新娘馆纳。我一直安慰自己,他們只是感情好汹桦,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布鲁驶。 她就那樣靜靜地躺著,像睡著了一般舞骆。 火紅的嫁衣襯著肌膚如雪钥弯。 梳的紋絲不亂的頭發(fā)上壹罚,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天,我揣著相機與錄音寿羞,去河邊找鬼猖凛。 笑死,一個胖子當著我的面吹牛绪穆,可吹牛的內(nèi)容都是我干的辨泳。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼玖院,長吁一口氣:“原來是場噩夢啊……” “哼菠红!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起难菌,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤试溯,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后郊酒,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體遇绞,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年燎窘,在試婚紗的時候發(fā)現(xiàn)自己被綠了摹闽。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡褐健,死狀恐怖付鹿,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蚜迅,我是刑警寧澤舵匾,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站谁不,受9級特大地震影響坐梯,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜拍谐,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一烛缔、第九天 我趴在偏房一處隱蔽的房頂上張望馏段。 院中可真熱鬧轩拨,春花似錦、人聲如沸院喜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽喷舀。三九已至砍濒,卻和暖如春淋肾,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背爸邢。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工樊卓, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人杠河。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓碌尔,卻偏偏與公主長得像,于是被迫代替她去往敵國和親券敌。 傳聞我的和親對象是個殘疾皇子唾戚,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容