移動(dòng)端爬蟲(chóng)--項(xiàng)目實(shí)踐loach--爬去抖音數(shù)據(jù)(四)

文集 移動(dòng)端網(wǎng)頁(yè)端爬蟲(chóng)

源碼

3 2.gif

1.gif

loach

  • loach是一個(gè)移動(dòng)端爬蟲(chóng)占调,針對(duì)現(xiàn)下很火的短視頻app—抖音

    1. 支持多個(gè)android設(shè)備并行自動(dòng)化
    2. 支持任意android設(shè)備的服務(wù)端部署到任意機(jī)器
    3. 支持使用http方法控制任務(wù)
    4. 支持常規(guī)爬取,搜索佃却,私信,話題四個(gè)部分 API示例
  • 示意圖

    image
  1. appium 提供了一組restful接口用來(lái)控制設(shè)備
  2. scheduler會(huì)將從http接收到的command在存在可用設(shè)備的時(shí)候丟給設(shè)備去執(zhí)行
    1. 對(duì)于CRAWLING類(lèi)型的任務(wù),是長(zhǎng)期有效的,即任務(wù)沒(méi)有終結(jié)點(diǎn)镜豹,設(shè)備會(huì)被永久占用
    2. 對(duì)于FINDING類(lèi)型的任務(wù),重試三次
  3. 確保android sdk正確配置并adb devices能看到設(shè)備
  • QAQ

    1. 整個(gè)系統(tǒng)有哪些組成蓝牲?

      loach進(jìn)程、appium實(shí)例若干泰讽、android設(shè)備若干(數(shù)量等于appium實(shí)例數(shù)量)

    2. 一句話概括loach的邏輯例衍?

      http api控制loach(shceduler),loach控制appium實(shí)例已卸,appium實(shí)例控制android設(shè)備

    3. 部署對(duì)網(wǎng)絡(luò)的要求

      loach進(jìn)程佛玄、appium實(shí)例、android設(shè)備必須相互知道其它所在的位置累澡。即在同一LAN

    4. loach梦抢、appium、android只能在一臺(tái)機(jī)器上運(yùn)行么愧哟?

      不必奥吩,正如Q3,互通是唯一網(wǎng)絡(luò)要求

    5. 補(bǔ)充

      目前我使用i5+8Gwindows部署六臺(tái)設(shè)備很流暢蕊梧,如果需要大量部署的話霞赫。估計(jì)兩位數(shù)就上限了湃鹊。

      提供兩種思路:

      1. 分布式部署急但,一個(gè)loach帶十個(gè)設(shè)備還是很輕松的粘我,若干個(gè)loach進(jìn)程選擇一個(gè)作為master進(jìn)程并對(duì)外提供http服務(wù)
      2. 若干個(gè)loach并行衙猪,并各自對(duì)外提供http服務(wù)
  • 白話部署

    1. 環(huán)境

      appium: 1.8.1 實(shí)例六個(gè) 端口4723-4728

      設(shè)備:華為暢享7 SLA-TL10 六臺(tái) ip分別是 192.168.1.201-206 端口 5555-5560

      loach:1.2

    2. 啟動(dòng)

      1. adb連接設(shè)備

        adb connect 192.168.1.201:5555

        adb connect 192.168.1.202:5556

        adb connect 192.168.1.203:5557

        adb connect 192.168.1.204:5558

        adb connect 192.168.1.205:5559

        adb connect 192.168.1.206:5560

      2. 啟動(dòng)appium

        appium -p 4723 -bp 6001 -U 192.168.1.201

        appium -p 4724 -bp 6001 -U 192.168.1.202

        appium -p 4725 -bp 6001 -U 192.168.1.203

        appium -p 4726 -bp 6001 -U 192.168.1.204

        appium -p 4727 -bp 6001 -U 192.168.1.205

        appium -p 4728 -bp 6001 -U 192.168.1.206
        bp:并行啟動(dòng)最好指定扛拨,否則引發(fā)“socket ended by other party”

      3. 啟動(dòng)loach

        cd loach/loach/instances

        python app.py

      4. 添加任務(wù)

        POST 127.0.0.1:8080/douyin/task/devices/

        參數(shù)

        {
          "1": {
              "ip": "192.168.1.201",
              "port": 5555,
              "sip": "192.168.1.106",
              "sport":4723
            },
          "2": {
              "ip": "192.168.1.202",
              "port": 5556,
              "sip": "192.168.1.106",
              "sport":4724
            },
          "3": {
              "ip": "192.168.1.203",
              "port": 5557,
              "sip": "192.168.1.106",
              "sport":4725
            },
          "4": {
              "ip": "192.168.1.204",
              "port": 5558,
              "sip": "192.168.1.106",
              "sport":4726
            },
          "5": {
              "ip": "192.168.1.205",
              "port": 5559,
              "sip": "192.168.1.106",
              "sport":4727
            },
          "6": {
              "ip": "192.168.1.206",
              "port": 5560,
              "sip": "192.168.1.106",
              "sport":4728
            }
        }
        

        POST 127.0.0.1:8080/douyin/task/crawling/

        {
          "attrs":["following", "work", "like"]
        }
        
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末塞茅,一起剝皮案震驚了整個(gè)濱河市谣光,隨后出現(xiàn)的幾起案子行贪,更是在濱河造成了極大的恐慌十艾,老刑警劉巖抵代,帶你破解...
    沈念sama閱讀 223,207評(píng)論 6 521
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異疟羹,居然都是意外死亡主守,警方通過(guò)查閱死者的電腦和手機(jī)禀倔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,455評(píng)論 3 400
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)参淫,“玉大人救湖,你說(shuō)我怎么就攤上這事∠巡牛” “怎么了鞋既?”我有些...
    開(kāi)封第一講書(shū)人閱讀 170,031評(píng)論 0 366
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)耍铜。 經(jīng)常有香客問(wèn)我邑闺,道長(zhǎng),這世上最難降的妖魔是什么棕兼? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,334評(píng)論 1 300
  • 正文 為了忘掉前任陡舅,我火速辦了婚禮,結(jié)果婚禮上伴挚,老公的妹妹穿的比我還像新娘靶衍。我一直安慰自己,他們只是感情好茎芋,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,322評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布颅眶。 她就那樣靜靜地躺著,像睡著了一般田弥。 火紅的嫁衣襯著肌膚如雪涛酗。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,895評(píng)論 1 314
  • 那天偷厦,我揣著相機(jī)與錄音商叹,去河邊找鬼。 笑死只泼,一個(gè)胖子當(dāng)著我的面吹牛沈自,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辜妓,決...
    沈念sama閱讀 41,300評(píng)論 3 424
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼枯途,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了籍滴?” 一聲冷哼從身側(cè)響起酪夷,我...
    開(kāi)封第一講書(shū)人閱讀 40,264評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎孽惰,沒(méi)想到半個(gè)月后晚岭,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,784評(píng)論 1 321
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡勋功,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,870評(píng)論 3 343
  • 正文 我和宋清朗相戀三年坦报,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了库说。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,989評(píng)論 1 354
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡片择,死狀恐怖潜的,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情字管,我是刑警寧澤啰挪,帶...
    沈念sama閱讀 36,649評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站嘲叔,受9級(jí)特大地震影響亡呵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜硫戈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,331評(píng)論 3 336
  • 文/蒙蒙 一锰什、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧丁逝,春花似錦歇由、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,814評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)糊昙。三九已至辛掠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間释牺,已是汗流浹背萝衩。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,940評(píng)論 1 275
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留没咙,地道東北人猩谊。 一個(gè)月前我還...
    沈念sama閱讀 49,452評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像祭刚,于是被迫代替她去往敵國(guó)和親牌捷。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,995評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容