Python學(xué)習(xí)筆記(6):在 MongoDB 中篩選房源

我的代碼

from bs4 import BeautifulSoup
import requests
import pymongo

client = pymongo.MongoClient('localhost',27017)

duanzu_db = client['duanzu_db']
sheet_fy = duanzu_db['sheet_fy']

#觀察每一頁url的規(guī)律
urls = ['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(i) for i in range(1,3)]

#獲取房東性別信息
def get_lorder_sex(class_name):
    if class_name == ['member_girl_ico']:
        return '女'
    elif class_name == ['member_boy_ico']:
        return '男'

#獲取房源鏈接信息
def get_links(url):
    wq_data = requests.get(url)
    soup = BeautifulSoup(wq_data.text,'lxml')
    links = soup.select('#page_list > ul > li > a')
    for link in links:
        href = link.get('href')
        get_attraction(href)

def get_attraction(url,data=None):
    wb_data = requests.get(url)

    #采用lxml引擎解析請求得到的列表頁面數(shù)據(jù)
    soup = BeautifulSoup(wb_data.text,'lxml')

    #Chrome瀏覽器打開網(wǎng)頁,把鼠標(biāo)放相應(yīng)信息上,右鍵,檢查元素,Copy Css Path,去掉:nth-child()
    titles = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em')
    adds = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span')
    rends = soup.select('div.day_l > span')
    imgs = soup.select('div.pho_show_l > div.pho_show_big > div > img')
    img_householders =  soup.select('div.js_box.clearfix > div.member_pic > a > img')
    names = soup.select('div.js_box.clearfix > div.w_240 > h6 > a')
    genders = soup.select('div.js_box.clearfix > div.w_240 > h6 > span')

    for title,add,rend,img,img_householder,name,gender in zip(titles,adds,rends,imgs,img_householders,names,genders):
        #從標(biāo)簽里提取內(nèi)容,get_text()得到文本,get()得到屬性內(nèi)容,get()得到的是列表,不是字符串
        data = {
            'title':title.get_text(),
            'add':add.get_text(),
            'rend':rend.get_text(),
            'img':img.get('src'),
            'img_householder':img_householder.get('src'),
            'name':name.get_text(),
            'gender':get_lorder_sex(gender.get('class'))
        }
        sheet_fy.insert_one(data)

def find_sheet_fy():
    # 從duanzu_db數(shù)據(jù)庫的sheet_fy表伐厌,查詢所有數(shù)據(jù)邻悬,用find()函數(shù)
    for info in sheet_fy.find():
        if int(info['rend']) >= 500:
            print(info)

for single_url in urls:
    get_links(single_url)

find_sheet_fy()

總結(jié)

  • 可直接在find方法里面寫篩選條件:
for info in sheet_fy.find({'rend':{'$gte':500}}):
  • $lt/$lte/$gt/$gte/$ne泊脐,依次等價于</<=/>/>=/!=佛寿。
    (l表示less g表示greater e表示equal n表示not )
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末默责,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子句柠,更是在濱河造成了極大的恐慌浦译,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件溯职,死亡現(xiàn)場離奇詭異精盅,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)谜酒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門叹俏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人甚带,你說我怎么就攤上這事〖淹罚” “怎么了鹰贵?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長康嘉。 經(jīng)常有香客問我碉输,道長,這世上最難降的妖魔是什么亭珍? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任敷钾,我火速辦了婚禮枝哄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘阻荒。我一直安慰自己挠锥,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布侨赡。 她就那樣靜靜地躺著蓖租,像睡著了一般。 火紅的嫁衣襯著肌膚如雪羊壹。 梳的紋絲不亂的頭發(fā)上蓖宦,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機(jī)與錄音油猫,去河邊找鬼稠茂。 笑死,一個胖子當(dāng)著我的面吹牛情妖,可吹牛的內(nèi)容都是我干的睬关。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼鲫售,長吁一口氣:“原來是場噩夢啊……” “哼共螺!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起情竹,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤藐不,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后秦效,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雏蛮,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年阱州,在試婚紗的時候發(fā)現(xiàn)自己被綠了挑秉。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡苔货,死狀恐怖犀概,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情夜惭,我是刑警寧澤姻灶,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站诈茧,受9級特大地震影響产喉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一曾沈、第九天 我趴在偏房一處隱蔽的房頂上張望这嚣。 院中可真熱鬧,春花似錦塞俱、人聲如沸姐帚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽卧土。三九已至,卻和暖如春像樊,著一層夾襖步出監(jiān)牢的瞬間尤莺,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工生棍, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留颤霎,地道東北人。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓涂滴,卻偏偏與公主長得像友酱,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子柔纵,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容