爬取豆瓣新書速遞

這個爬蟲比較簡單刚梭,一個固定URL,數(shù)據(jù)獲取也比較有規(guī)律贴铜。最后是把獲取到到書名氓扛、簡介、評分维苔、作者出版社信息寫入本地的一個文件中

# coding:utf-8
import requests
from bs4 import BeautifulSoup
import sys  
  
reload(sys)  
sys.setdefaultencoding('utf8')   

def get_latest_book():
    url='https://book.douban.com/latest?icn=index-latestbook-all'
    response=requests.get(url)
    bookList=[]
    soup=BeautifulSoup(response.content,'html.parser')
    bookNameList=soup.select('.article .detail-frame a')
    bookRateList=soup.select('.article .color-lightgray')
    bookInfoList=soup.select('.article .color-gray')
    bookDetailList=soup.select('.article .detail')
    for v in range(len(bookNameList)):
        bookDict={}
        bookDict={
            'bookName':bookNameList[v].text,
            'bookRate':bookRateList[v].text,
            'bookInfo':bookInfoList[v].text,
            'bookDetail':bookDetailList[v].text
        }
        bookList.append(bookDict)
    return bookList

def write_file():
    with open('豆瓣新書速遞.txt','w+') as f:
        bookList=get_latest_book()
        for book in bookList:
            bookName=book['bookName']
            bookRate=book['bookRate']
            bookInfo=book['bookInfo']
            bookDetail=book['bookDetail']
            f.write(bookName)
            f.write(bookRate)
            f.write(bookInfo)
            f.write(bookDetail)
        print '數(shù)據(jù)寫入完畢'  
        
write_file()
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末碰辅,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子介时,更是在濱河造成了極大的恐慌没宾,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件沸柔,死亡現(xiàn)場離奇詭異循衰,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)褐澎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進(jìn)店門会钝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人工三,你說我怎么就攤上這事迁酸。” “怎么了俭正?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵奸鬓,是天一觀的道長。 經(jīng)常有香客問我掸读,道長串远,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任寺枉,我火速辦了婚禮抑淫,結(jié)果婚禮上绷落,老公的妹妹穿的比我還像新娘姥闪。我一直安慰自己,他們只是感情好砌烁,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布筐喳。 她就那樣靜靜地躺著催式,像睡著了一般。 火紅的嫁衣襯著肌膚如雪避归。 梳的紋絲不亂的頭發(fā)上荣月,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天,我揣著相機(jī)與錄音梳毙,去河邊找鬼哺窄。 笑死,一個胖子當(dāng)著我的面吹牛账锹,可吹牛的內(nèi)容都是我干的萌业。 我是一名探鬼主播,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼奸柬,長吁一口氣:“原來是場噩夢啊……” “哼生年!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起廓奕,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤抱婉,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后桌粉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蒸绩,經(jīng)...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年铃肯,在試婚紗的時候發(fā)現(xiàn)自己被綠了侵贵。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡缘薛,死狀恐怖窍育,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情宴胧,我是刑警寧澤漱抓,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站恕齐,受9級特大地震影響乞娄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜显歧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一仪或、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧士骤,春花似錦范删、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽旨巷。三九已至,卻和暖如春添忘,著一層夾襖步出監(jiān)牢的瞬間采呐,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工搁骑, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留斧吐,地道東北人。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓仲器,卻偏偏與公主長得像会通,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子娄周,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,326評論 25 707
  • 爬取豆瓣TOP250圖書榜的出版社分布(一)-urllib2 0. 需求 現(xiàn)在準(zhǔn)備爬取豆瓣上的圖書TOP250然后...
    KevinCool閱讀 629評論 0 0
  • ?先來看看頁面長啥樣的:https://book.douban.com/top250 ?我們將要爬取哪些信息:書名...
    ZhuNewNew閱讀 1,046評論 0 7
  • 心理課涕侈,老師給了一組數(shù)據(jù),關(guān)于大學(xué)生壓力來源的排行煤辨。第二名裳涛,父母下崗。 巧的是众辨,前一天端三,我得知母親下崗。 其實這不...
    嘿別懶了閱讀 168評論 1 0
  • 朋友的老公是個老實人,可是蛛株,有一天团赁,朋友發(fā)現(xiàn)老公和一個女同事有點(diǎn)不清楚,那個女人可是單位有名的綠茶婊谨履,清湯寡水的頭...
    健的XUYU閱讀 1,275評論 0 1