1600萬的整數(shù)排序pingcap-talent-plan(1)

Merge Sort

問題描述

Go 語言實現(xiàn)一個16M的整數(shù)(int64)多路歸并的數(shù)組排序

思路

將待排序數(shù)組分成多個組,利用多個goroutine實現(xiàn)各個組的并行排序蚌本;然后通過Heap(最小堆)進行多路歸并排序扯再;

實現(xiàn)

實現(xiàn)一個協(xié)程池實現(xiàn)任務(wù)的并行處理持际,將待排序切片分組并封裝成SortTask放入?yún)f(xié)程池
運行开镣,待全部執(zhí)行完成后ConcurrentSorter收集排序結(jié)果,并封裝成MergeTask放入?yún)f(xié)程池中進行合并荚藻。

  • 協(xié)程池pool.go

    • 配置最大協(xié)程數(shù)量
    • 按需創(chuàng)建協(xié)程
    • 空閑超時則回收協(xié)程
  • 合并有序切片algorithm.heap_merge.go
    若采用2路循環(huán)合并屋灌,每次合并需要申請長度為2路之和的內(nèi)存保存合并結(jié)果,循環(huán)合并會導(dǎo)致過多的內(nèi)存申請应狱。通過堆實現(xiàn)多路的有序切片的合并共郭,只需要額外申請一次一倍的內(nèi)存用于存放合并結(jié)果。

歸并算法

輸入:n路待合并的有序slice
輸出:有序slice

堆node定義為一個SortedSlice疾呻,實現(xiàn)了hasNext函數(shù)除嘹,用于迭代到當(dāng)前slice的下一個元素;

type Iterator struct {
    slice []int64
    index int
}

func (i *Iterator) HasNext() bool {
    return i.index < len(i.slice)-1
}

func (i *Iterator) Next() {
    i.index++
}

func (i *Iterator) Value() int64 {
    return i.slice[i.index]
}

type SortedSlice struct {
    slice []int64
    Iterator
}

堆的定義:

type HeapMerge struct {
    nodes []*SortedSlice
}
  1. 構(gòu)建一個n個元素的最小堆
  2. 從每路slice中取首個元素組成數(shù)組岸蜗,調(diào)整堆尉咕;每次從堆頂,取一個元素璃岳,放入合并后的slice中
    • 如果hasNext=true年缎,執(zhí)行當(dāng)前node的Next(),重新調(diào)整當(dāng)前的原因
    • 如果hasNext=false, 當(dāng)前slice已經(jīng)空了铃慷,因此剔除堆頂, 然后需要重建堆单芜,原因是堆中的父子關(guān)系已經(jīng)破壞。
if h.nodes[0].HasNext() {
    h.nodes[0].Next() //不需要獲取值
    h.adjust(0, len(h.nodes))
} else { // 頂部的node(slice)已經(jīng)為空
    if len(h.nodes) >= 1 {
        // 移除為已經(jīng)合并完成的slice
        h.nodes = h.nodes[1:]
        //h.adjust(0, len(h.nodes))
        h.Build()
    } else {
        return 0, errors.New("merge complete")
    }
}

代碼結(jié)構(gòu)

截屏2020-03-1318.33.34.png

性能測試

并發(fā)8路排序的的情況下犁柜,性能大約提升三倍洲鸠,主要原因是分組排序之后需要進行多路的合并。測試結(jié)果如下:

截屏2020-03-1317.11.58.png

內(nèi)存消耗比直接排序增加了128M赁温,是因為合并排序結(jié)果過程申請了一塊內(nèi)存來暫存結(jié)果128M = 16M*8B

截屏2020-03-1317.12.43.png

cpu的消耗大多在排序過程坛怪,merge過程5%


截屏2020-03-1317.18.11.png

merge過程中調(diào)用append(slice)消耗了290ms,直接改為修改slice的下標(biāo)竟然減少了大約10ms股囊。

截屏2020-03-1317.20.47.png

截屏2020-03-1319.05.17.png

github-mergesort源碼

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末袜匿,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子稚疹,更是在濱河造成了極大的恐慌居灯,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件内狗,死亡現(xiàn)場離奇詭異怪嫌,居然都是意外死亡,警方通過查閱死者的電腦和手機柳沙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進店門岩灭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人赂鲤,你說我怎么就攤上這事噪径≈簦” “怎么了?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵找爱,是天一觀的道長梗顺。 經(jīng)常有香客問我,道長车摄,這世上最難降的妖魔是什么寺谤? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮吮播,結(jié)果婚禮上变屁,老公的妹妹穿的比我還像新娘。我一直安慰自己意狠,他們只是感情好敞贡,可當(dāng)我...
    茶點故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著摄职,像睡著了一般。 火紅的嫁衣襯著肌膚如雪获列。 梳的紋絲不亂的頭發(fā)上谷市,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天,我揣著相機與錄音击孩,去河邊找鬼迫悠。 笑死,一個胖子當(dāng)著我的面吹牛巩梢,可吹牛的內(nèi)容都是我干的创泄。 我是一名探鬼主播,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼括蝠,長吁一口氣:“原來是場噩夢啊……” “哼鞠抑!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起忌警,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤搁拙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后法绵,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體箕速,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年朋譬,在試婚紗的時候發(fā)現(xiàn)自己被綠了盐茎。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,110評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡徙赢,死狀恐怖字柠,靈堂內(nèi)的尸體忽然破棺而出探越,到底是詐尸還是另有隱情,我是刑警寧澤募谎,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布扶关,位于F島的核電站,受9級特大地震影響数冬,放射性物質(zhì)發(fā)生泄漏节槐。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一拐纱、第九天 我趴在偏房一處隱蔽的房頂上張望铜异。 院中可真熱鬧,春花似錦秸架、人聲如沸揍庄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蚂子。三九已至,卻和暖如春缭黔,著一層夾襖步出監(jiān)牢的瞬間食茎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工馏谨, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留别渔,地道東北人。 一個月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓惧互,卻偏偏與公主長得像哎媚,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子喊儡,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,047評論 2 355