相關(guān)文章
- 海量數(shù)據(jù)處理之經(jīng)典實例分析
top k 問題中各種場景分析的很好:
單機+單核+足夠大內(nèi)存
單機+多核+足夠大內(nèi)存
單機+單核+受限內(nèi)存
多機+受限內(nèi)存
https://segmentfault.com/a/1190000000510258
- 多路歸并思路
http://www.cnblogs.com/daoluanxiaozi/archive/2012/03/29/2423087.html - 外排序:如何給10^7個數(shù)據(jù)量的磁盤文件排序
位圖和多路歸并食铐、都有實現(xiàn)
http://blog.csdn.net/v_JULY_v/article/details/6451990
注:隨機數(shù)產(chǎn)生必須srand()和rand()配合使用函數(shù)一:int rand(void);從srand (seed)中指定的seed開始,返回一個[seed, RAND_MAX(0x7fff))間的隨機整數(shù)饶氏。
函數(shù)二:void srand(unsigned seed)岂津;參數(shù)seed是rand()的種子硝皂,用來初始化rand()的起始值疫剃。
可以認為rand()在每次被調(diào)用的時候桨菜,它會查看:
1) 如果用戶在此之前調(diào)用過srand(seed)仍侥,給seed指定了一個值要出,那么它會自動調(diào)用srand(seed)一次來初始化它的起始值。
2) 如果用戶在此之前沒有調(diào)用過srand(seed)农渊,它會自動調(diào)用srand(1)一次患蹂。
參考鏈接:http://blog.sina.com.cn/s/blog_8cf0057a01011ekt.html - 倒排索引與正排索引
概念解釋的很清楚
http://blog.sina.com.cn/s/blog_5b29caf701015tpa.html - 倒排索引關(guān)鍵詞不重復Hash編碼:(這個可以選擇了解)
https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/%E5%80%92%E6%8E%92%E7%B4%A2%E5%BC%95%E5%85%B3%E9%94%AE%E8%AF%8D%E4%B8%8D%E9%87%8D%E5%A4%8DHash%E7%BC%96%E7%A0%81.md - 海量數(shù)據(jù)中尋找中位數(shù)
http://www.voidcn.com/blog/zhouwei1221q/article/p-3715373.html
教你如何迅速秒殺掉:99%的海量數(shù)據(jù)處理面試題(july總結(jié)很全面)
http://blog.csdn.net/v_july_v/article/details/7382693
海量數(shù)據(jù)處理之歸并、堆排、前K方法的應用:一道面試題(一提多法)
http://www.ahathinking.com/archives/19.html
題集
http://blog.csdn.net/wdzxl198/article/details/8925892
https://github.com/nonstriater/Learn-Algorithms/blob/master/%E7%AE%97%E6%B3%95%E9%97%AE%E9%A2%98%E9%80%89%E7%BC%96/%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86.md