python3爬蟲實(shí)例(二)-bs4抓取大學(xué)排名儲(chǔ)存為txt

運(yùn)行版本:
Python 3.7.0
完整代碼如下:

# coding:utf-8
import requests
from bs4 import BeautifulSoup
import  bs4


def gethtml(url,headers):
    response =  requests.get(url,headers=headers)
    try:
        if response.status_code == 200:
            print('抓取成功網(wǎng)頁長度:',len(response.text))
            response.encoding = 'utf-8'
            return response.text
    except BaseException as e:
        print('抓取出現(xiàn)錯(cuò)誤:',e)

def getsoup(html):
    soup = BeautifulSoup(html,'lxml')
    for tr in soup.find('tbody').children:  #生成tr的tag列表
        if isinstance(tr,bs4.element.Tag):
            td = tr('td')          #循環(huán)獲取所有tr標(biāo)簽下的td標(biāo)簽噪奄,并生成tag列表
            t = [td[0].string, td[1].string,'    ',td[2].string,'   ',td[3].string]   #提取前四td字符串
            list.append(t)

def write_data(list):
   for i in list:   #循環(huán)提取list中的元素
    with open('daxue.txt','a') as  data:
                print(i,file=data)          #寫入文件


if __name__ == '__main__':
    list = []
    url = 'http://www.zuihaodaxue.com/shengyuanzhiliangpaiming2018.html'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'
    }
    html = gethtml(url,headers)
    getsoup(html)
    write_data(list)

運(yùn)行結(jié)果:

圖片.png

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末死姚,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子勤篮,更是在濱河造成了極大的恐慌都毒,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,376評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件碰缔,死亡現(xiàn)場離奇詭異账劲,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)金抡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門瀑焦,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人梗肝,你說我怎么就攤上這事榛瓮。” “怎么了巫击?”我有些...
    開封第一講書人閱讀 156,966評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵禀晓,是天一觀的道長精续。 經(jīng)常有香客問我,道長匆绣,這世上最難降的妖魔是什么驻右? 我笑而不...
    開封第一講書人閱讀 56,432評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮崎淳,結(jié)果婚禮上堪夭,老公的妹妹穿的比我還像新娘。我一直安慰自己拣凹,他們只是感情好森爽,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,519評(píng)論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著嚣镜,像睡著了一般爬迟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上菊匿,一...
    開封第一講書人閱讀 49,792評(píng)論 1 290
  • 那天付呕,我揣著相機(jī)與錄音,去河邊找鬼跌捆。 笑死徽职,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的佩厚。 我是一名探鬼主播姆钉,決...
    沈念sama閱讀 38,933評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼抄瓦!你這毒婦竟也來了潮瓶?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,701評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤钙姊,失蹤者是張志新(化名)和其女友劉穎毯辅,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體煞额,經(jīng)...
    沈念sama閱讀 44,143評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡悉罕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,488評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了立镶。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,626評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡类早,死狀恐怖媚媒,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情涩僻,我是刑警寧澤缭召,帶...
    沈念sama閱讀 34,292評(píng)論 4 329
  • 正文 年R本政府宣布栈顷,位于F島的核電站,受9級(jí)特大地震影響嵌巷,放射性物質(zhì)發(fā)生泄漏萄凤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,896評(píng)論 3 313
  • 文/蒙蒙 一搪哪、第九天 我趴在偏房一處隱蔽的房頂上張望靡努。 院中可真熱鬧,春花似錦晓折、人聲如沸惑朦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽漾月。三九已至,卻和暖如春胃珍,著一層夾襖步出監(jiān)牢的瞬間梁肿,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國打工觅彰, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留吩蔑,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓缔莲,卻偏偏與公主長得像哥纫,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子痴奏,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,494評(píng)論 2 348