基于golang爬蟲框架gathertool快速編寫并發(fā)抓取國內(nèi)ip信息

@TOC

gathertool

直接上code

package main

import (
    "log"
    "net/http"
    "time"
    "github.com/PuerkitoBio/goquery"
    gt "github.com/mangenotwork/gathertool"
)

var queue = gt.NewQueue() //全局聲明抓取任務(wù)隊列
func main(){
    // 1.在頁面 http://ip.bczs.net/country/CN 獲取所以ip
    c, err := gt.Get("http://ip.bczs.net/country/CN",gt.SucceedFunc(IPListSucceed))
    if err != nil{
        log.Println(err)
        return
    }
    c.Do() //執(zhí)行請求
    // 2. 并發(fā)抓取詳情數(shù)據(jù)
    gt.StartJobGet(100,queue,
        gt.SucceedFunc(GetIPSucceed),//請求成功后執(zhí)行的方法
        gt.RetryFunc(GetIPRetry),//遇到 502,403 等狀態(tài)碼重試前執(zhí)行的方法凛忿,一般為添加休眠時間或更換代理
        gt.FailedFunc(GetIPFailed),//請求失敗后執(zhí)行的方法
        )
}

// 請求成功執(zhí)行
func IPListSucceed(cxt *gt.Context){
    html := string(cxt.RespBody)
    dom,err := gt.NewGoquery(html)
    if err != nil{
        log.Println(err)
        return
    }
    result := dom.Find("div[id=result] tbody")
    result.Find("tr").Each(func(i int, tr *goquery.Selection){
        td := tr.Find("td")
        startIp := td.Eq(0).Text()// IP起始
        endIP := td.Eq(1).Text()// 結(jié)束ip
        number := td.Eq(2).Text()// ip數(shù)量
        // 創(chuàng)建隊列 抓取詳情信息
        queue.Add(&gt.Task{
            Url: "http://ip.bczs.net/"+startIp,
            Data: map[string]interface{}{
                "start_ip":startIp,
                "end_ip":endIP,
                "number":number,
            },
        })
    })
}

// 獲取詳情信息成功的處理
func GetIPSucceed(c *gt.Context){
    html := string(c.RespBody)
    dom,err := gt.NewGoquery(html)
    if err != nil{
        log.Println(err)
        return
    }
    result,err := dom.Find("div[id=result] .well").Html()
    if err != nil{
        log.Println(err)
    }
    log.Println(c.Task.Data, result)
}

// 獲取詳情信息重試的處理
func GetIPRetry(c *gt.Context){
    //更換代理
    c.Client = &http.Client{
        //Transport: &http.Transport{
        //  Proxy: http.ProxyURL(uri),
        //},
        Timeout: 5*time.Second,
    }
    time.Sleep(1*time.Second)
}

// 獲取詳情信息失敗執(zhí)行
func GetIPFailed(c *gt.Context){
    queue.Add(c.Task)//請求失敗歸還到隊列
}
在這里插入圖片描述
在這里插入圖片描述
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末脑漫,一起剝皮案震驚了整個濱河市粘我,隨后出現(xiàn)的幾起案子官卡,更是在濱河造成了極大的恐慌部逮,老刑警劉巖院促,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件扒俯,死亡現(xiàn)場離奇詭異,居然都是意外死亡一疯,警方通過查閱死者的電腦和手機(jī)撼玄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來墩邀,“玉大人掌猛,你說我怎么就攤上這事∶级茫” “怎么了荔茬?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長竹海。 經(jīng)常有香客問我慕蔚,道長,這世上最難降的妖魔是什么斋配? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任孔飒,我火速辦了婚禮灌闺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘坏瞄。我一直安慰自己桂对,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布鸠匀。 她就那樣靜靜地躺著蕉斜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪缀棍。 梳的紋絲不亂的頭發(fā)上宅此,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機(jī)與錄音爬范,去河邊找鬼父腕。 笑死,一個胖子當(dāng)著我的面吹牛坦敌,可吹牛的內(nèi)容都是我干的侣诵。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼狱窘,長吁一口氣:“原來是場噩夢啊……” “哼杜顺!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蘸炸,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤躬络,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后搭儒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體穷当,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年淹禾,在試婚紗的時候發(fā)現(xiàn)自己被綠了馁菜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡铃岔,死狀恐怖汪疮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情毁习,我是刑警寧澤智嚷,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站纺且,受9級特大地震影響盏道,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜载碌,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一猜嘱、第九天 我趴在偏房一處隱蔽的房頂上張望衅枫。 院中可真熱鬧,春花似錦泉坐、人聲如沸为鳄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至歧斟,卻和暖如春纯丸,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背静袖。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工觉鼻, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人队橙。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓坠陈,卻偏偏與公主長得像,于是被迫代替她去往敵國和親捐康。 傳聞我的和親對象是個殘疾皇子仇矾,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容