分析:
IP總個(gè)數(shù)2^32 = 4G蛀骇,如果單機(jī)用一個(gè)hash表來(lái)存儲(chǔ),光IP部分就得4G*4 = 16G读拆,不現(xiàn)實(shí)
把文件按照hash(IP)%1000的方式分割成1000個(gè)小文件擅憔,相同IP的日志肯定落到了同一個(gè)文件中,針對(duì)每一個(gè)小文件建椰,用hash_map統(tǒng)計(jì)出次數(shù)最多的那個(gè)IP雕欺,得到1000個(gè)“最多”的IP,然后在這1000個(gè)“最多”的IP中找到最大的即可棉姐。