Python實(shí)戰(zhàn)計(jì)劃學(xué)習(xí)筆記(8)MongoDB存儲(chǔ)

心得

  1. 調(diào)用MongoDB需要導(dǎo)入pymongo庫(kù)
  2. MongoDB中也有庫(kù)(db)和表(collection)的概念赡盘,可以用use,show collections缰揪,find()方法來查看
  3. 插入數(shù)據(jù)使用insert_one()方法陨享,可以在循環(huán)中隨時(shí)入庫(kù),不用再使用專用列表來存儲(chǔ)钝腺,數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以保留長(zhǎng)期反復(fù)使用抛姑。
  4. 數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以使用mongoexport.exe導(dǎo)出(如json、csv格式)艳狐,也可以使用mongoimport將外部數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)
  5. find()方法可以對(duì)結(jié)果進(jìn)行條件篩選

我的代碼

找到小豬短租網(wǎng)站的列表頁(yè)前三頁(yè)上月租500元以上的房源信息

from bs4 import BeautifulSoup
import requests
import time
import pymongo
client = pymongo.MongoClient('localhost',27017)
urls = ['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(str(i)) for i in range(1,4,1)]
xiaozhu = client['xiaozhu']
sheet_lines = xiaozhu['sheet_lines']

def get_page_info(url):
    web_data = requests.get(url)
    soup = BeautifulSoup(web_data.text,'lxml')
    titles = soup.select('div.result_btm_con.lodgeunitname > div > a > span')
    links = soup.select('div.result_btm_con.lodgeunitname')
    prices = soup.select('div.result_btm_con.lodgeunitname > span.result_price > i')
    types = soup.select('div.result_btm_con.lodgeunitname > div > em.hiddenTxt')
    for title, type,price,link in zip(titles, types, prices,links):
        data = {
            'title':title.get_text(),
            'link': link.get('detailurl'),
            'unit':type.get_text().split('\n')[1].replace(' ',''),
            #'comment':type.get_text().split('\n')[7].replace(' ',''),
            'price':int(price.get_text())  #變成數(shù)字才能根據(jù)大小并檢索
        }
        sheet_lines.insert_one(data) #注入數(shù)據(jù)庫(kù)


for single_url in urls:
    get_page_info(single_url)
    time.sleep(2)

for item in sheet_lines.find({'price':{'$gte':500}}):
    print(item)

運(yùn)行結(jié)果

  • 數(shù)據(jù)庫(kù)內(nèi)數(shù)據(jù)
1.jpg
  • 篩選結(jié)果
2.jpg
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末定硝,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子毫目,更是在濱河造成了極大的恐慌喷斋,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蒜茴,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡浆西,警方通過查閱死者的電腦和手機(jī)粉私,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來近零,“玉大人诺核,你說我怎么就攤上這事抄肖。” “怎么了窖杀?”我有些...
    開封第一講書人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵漓摩,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我入客,道長(zhǎng)管毙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任桌硫,我火速辦了婚禮夭咬,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘铆隘。我一直安慰自己卓舵,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開白布膀钠。 她就那樣靜靜地躺著掏湾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肿嘲。 梳的紋絲不亂的頭發(fā)上融击,一...
    開封第一講書人閱讀 51,727評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音睦刃,去河邊找鬼砚嘴。 笑死,一個(gè)胖子當(dāng)著我的面吹牛涩拙,可吹牛的內(nèi)容都是我干的际长。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼兴泥,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼工育!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起搓彻,我...
    開封第一講書人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤如绸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后旭贬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體怔接,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年稀轨,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了扼脐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡奋刽,死狀恐怖瓦侮,靈堂內(nèi)的尸體忽然破棺而出艰赞,到底是詐尸還是另有隱情,我是刑警寧澤肚吏,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布方妖,位于F島的核電站,受9級(jí)特大地震影響罚攀,放射性物質(zhì)發(fā)生泄漏党觅。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一坞生、第九天 我趴在偏房一處隱蔽的房頂上張望仔役。 院中可真熱鬧,春花似錦是己、人聲如沸又兵。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)沛厨。三九已至,卻和暖如春摔认,著一層夾襖步出監(jiān)牢的瞬間逆皮,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工参袱, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留电谣,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓抹蚀,卻偏偏與公主長(zhǎng)得像剿牺,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子环壤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容