用powerbi爬取安居客昆明所有樓盤詳情頁

方法一:powerbi爬取安居客

不得不佩服powerbi脆粥,真是入得洞房(你沒看錯砌溺,就是洞房,不是廚房)变隔、上得廳堂规伐,除了能夠連接一百多種數(shù)據(jù)源,居然還是一個好用的爬蟲匣缘。

第一步:確保power bi desktop是最新版并打開它猖闪。

第二步:在安居客網(wǎng)站找到昆明新房源的鏈接,復(fù)制備用肌厨。

第三步:新建一個來自于web的數(shù)據(jù)源培慌。

添加Web源

注意上圖中的位置3,要點擊“使用示例添加表”柑爸。

第四步:手動添加需爬取的字段吵护。

使用示例添加表

如上圖所示,我們想爬取的第一個字段是樓盤名字,我們在“列1”第一行中手動輸入想爬取的第一個樓盤名字何址。確保一一對應(yīng)里逆。

當(dāng)你輸入開頭幾個字時,powerbi desktop會智能地提示用爪,雙擊提示原押,就會自動填充。

絕大多數(shù)時候偎血,我們輸入第一個樓盤名字之后诸衔,powerbi desktop就會智能地幫我們把其他樓盤名字依次填到“列1”。

添加需爬取的字段

如上圖所示颇玷,灰色部分為powerbi desktop自動填充的笨农。

如果輸入第一個樓盤后,powerbi desktop沒有自動填充其他樓盤帖渠,不用擔(dān)心谒亦,這是因為power bi desktop還沒找到規(guī)律,所以當(dāng)你再寫一個樓盤名字后空郊,它就知道該怎么填充了份招。

點紅圈處的*號可以增加爬取的字段列。雙擊列名稱可以重命名狞甚,比如我將列重命名為“樓盤名稱”锁摔、“價格”和“戶型”。

確保所有要爬取的字段都列出來之后哼审,點擊確定谐腰,進入下一步。

第五步:加載或編輯爬取結(jié)果涩盾。

勾選自定義表

上一步確定后十气,進入上圖的界面,點擊“加載”旁赊,就可以查看爬取結(jié)果了桦踊。如果對自動抓取的結(jié)果不滿意,可以點“編輯”终畅,進入編輯查詢界面籍胯,對查詢語句進行修改。

第六步:翻頁离福。

注意我們前面爬取的只是一頁內(nèi)容杖狼。一頁只有幾十個樓盤。昆明可是有幾百個樓盤的妖爷,安居客用了8頁來顯示蝶涩,因此理朋,我們需要確保能把八頁內(nèi)容全部爬取下來。

所以我們在上一步點擊“編輯”绿聘,進入查詢編輯頁面嗽上。

這里我們要分四步走:

首先是把剛才建立的查詢重命名下,便于識別熄攘,比如我重命名為“base”兽愤。

其次要拿到總頁數(shù),這個好辦挪圾。在左側(cè)查詢列表欄右鍵點擊浅萧,新建一個空白查詢。

總頁數(shù)的查詢

然后在公式欄輸入“= {1..8}”哲思,這表示新建一個包含1到8共8個元素的列表洼畅。列表不好操作,所以我們把它轉(zhuǎn)化成表棚赔,在窗口左上角點“到表”帝簇。再把列格式設(shè)置為文本。

將頁數(shù)查詢轉(zhuǎn)化為表

接著我們要把base變成一個函數(shù)忆嗜。因為只有函數(shù)才能調(diào)用變量己儒,而變量就是我們剛才做的表格里的8個頁碼數(shù)字。

點擊菜單欄上的“管理參數(shù)”捆毫,新建一個page參數(shù)。

新建參數(shù)

然后把base查詢的第一個操作步驟代碼變成“= Web.BrowserContents("https://km.fang.anjuke.com/loupan/all/p" & page & "/")”

再右鍵選中base冲甘,在彈出菜單中選擇“創(chuàng)建函數(shù)”(下面截圖中是灰色的绩卤,是因為我已經(jīng)用它創(chuàng)建了一個函數(shù))。

創(chuàng)建函數(shù)

最后一步就是在頁碼表格中以新增一列的方式引用剛才創(chuàng)建的函數(shù):

領(lǐng)導(dǎo)給我一周時間讓梳理昆明所有樓盤的信息江醇,我半小時就完成了

然后點擊自定義列列標(biāo)題旁邊的展開符號濒憋,展開列,就得到我們想要的數(shù)據(jù)了:

領(lǐng)導(dǎo)給我一周時間讓梳理昆明所有樓盤的信息陶夜,我半小時就完成了

第七步:查看爬取結(jié)果凛驮。

展開自定義列

上圖就是我們爬取的結(jié)果,可以把它加載到數(shù)據(jù)模型条辟,進行下一步處理黔夭,如統(tǒng)計匯總,或?qū)С鰹閏sv格式發(fā)給領(lǐng)導(dǎo)羽嫡。

看上去步驟繁多本姥,但是對powerbi desktop操作熟悉的話,其實就是分分鐘的事情杭棵。

實際操作中主要耗時在爬取網(wǎng)頁內(nèi)容上婚惫。

尾巴

上面的七步其實爬取的是樓盤列表頁的樓盤信息。實際任務(wù)中我需要爬取每個樓盤頁面上的信息。其實思路都是一樣的:先爬取單個樓盤頁面的信息先舷,然后將其轉(zhuǎn)化為函數(shù)備用艰管;獲取到樓盤的鏈接地址,將其作為參數(shù)傳遞給函數(shù)蒋川;而樓盤頁面地址就可以直接從樓盤列表頁中獲取蛙婴。所以我沒有繼續(xù)往下寫具體的操作步驟了。

爬蟲老手應(yīng)該也注意到了尔破,我沒設(shè)置headers街图,也沒有設(shè)置等待時間,然而并沒有觸發(fā)安居客的反爬機制懒构,不知道powerbi desktop在背后怎么避免了觸發(fā)反爬機制餐济,或者只是我運氣好?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末胆剧,一起剝皮案震驚了整個濱河市絮姆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌秩霍,老刑警劉巖篙悯,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異铃绒,居然都是意外死亡鸽照,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門颠悬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來矮燎,“玉大人,你說我怎么就攤上這事赔癌〉猓” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵灾票,是天一觀的道長峡谊。 經(jīng)常有香客問我,道長刊苍,這世上最難降的妖魔是什么既们? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮班缰,結(jié)果婚禮上贤壁,老公的妹妹穿的比我還像新娘。我一直安慰自己埠忘,他們只是感情好脾拆,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布馒索。 她就那樣靜靜地躺著,像睡著了一般名船。 火紅的嫁衣襯著肌膚如雪绰上。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天渠驼,我揣著相機與錄音蜈块,去河邊找鬼。 笑死迷扇,一個胖子當(dāng)著我的面吹牛百揭,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蜓席,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼器一,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了厨内?” 一聲冷哼從身側(cè)響起祈秕,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎雏胃,沒想到半個月后请毛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡瞭亮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年方仿,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片街州。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡兼丰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出唆缴,到底是詐尸還是另有隱情,我是刑警寧澤黍翎,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布面徽,位于F島的核電站,受9級特大地震影響匣掸,放射性物質(zhì)發(fā)生泄漏趟紊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一碰酝、第九天 我趴在偏房一處隱蔽的房頂上張望霎匈。 院中可真熱鬧,春花似錦送爸、人聲如沸铛嘱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽墨吓。三九已至球匕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間帖烘,已是汗流浹背亮曹。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留秘症,地道東北人照卦。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像乡摹,于是被迫代替她去往敵國和親役耕。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容