北京二手房數(shù)據(jù)分析

一、數(shù)據(jù)來源:通過python爬取鏈家已交易的二手房數(shù)據(jù)

二、項目背景:通過二手房交易的歷史數(shù)據(jù)滋捶,觀測影響價格有哪些因素。

三余黎、初識數(shù)據(jù):讀取數(shù)據(jù)重窟,并對數(shù)據(jù)進行預覽

通過對數(shù)據(jù)的初步預覽,我們發(fā)現(xiàn)本次爬取的數(shù)據(jù)有5672個觀測數(shù)據(jù)惧财,有35個變量巡扇,最低價是每平米1505元,最高價是每平米155589元垮衷,差距還是挺大的厅翔,初識數(shù)據(jù)之后,下一步就需要進行需求對數(shù)據(jù)清進行洗了帘靡。

四知给、數(shù)據(jù)清洗

1)、數(shù)據(jù)處理的思想:根據(jù)缺失值的數(shù)量進行判斷是需要進行插補還是刪除描姚,包含異常值的進行刪除????或者百分0.5的進行賦值涩赢,為了便于分析需要將數(shù)據(jù)類型間的相互轉(zhuǎn)換以及不同量綱進行標準化。

2)轩勘、通過觀察發(fā)現(xiàn)部分成交的房價并不是一個值筒扒,而是給了一個區(qū)間,這里需要進行判斷绊寻,如果是一個值的話花墩,取值他本身悬秉,如果是區(qū)間的話去他們的均值,賦值新變量把原始的變量刪除后冰蘑,因為這部分占比比較小和泌,所以這樣處理對結(jié)果影響不大。

通過兩種刪除變量的方式祠肥,優(yōu)化之后數(shù)據(jù)還有30個變量武氓。

3)、接下來我們需要查看一下數(shù)據(jù)中是否包含缺失值仇箱,如果有县恕,哪些變量有缺水值,缺失值有多少剂桥,占比多少忠烛,是否超過了70%。

通過以上的操作权逗,發(fā)現(xiàn)缺失值主要是在成交時間上美尸,缺失值有171條,占比3%旬迹,通過對日期類型的轉(zhuǎn)換這樣就可以對日期進行計算了火惊,接著對日期變量進行描述可以看到成交日期的均值是在2020-01-31日,最后我們把成交日期的均值進行了缺水值填充奔垦,如果如果缺失值比較大屹耐,我們可以選擇進行多重插補法進行填充或者5%的分為點進行填充。

4)椿猎、為了方便后期分析的應(yīng)用惶岭,我們那可以把變量的名稱、位置進行調(diào)整:

5)犯眠、處理完缺失值后我們還需要查看數(shù)據(jù)是否存在異常值按灶,接下來讓我們先看看房價是否存在異常值。

最大面積2117平筐咧,而成交價僅僅是94元每平米鸯旁,單價最低的是406.09,而建筑面積是98.5平米量蕊,最低價是1萬元,最高價是3700萬铺罢,均價是272,建筑面積36平米残炮,這些數(shù)據(jù)是不太符合當前市場的所以需要把這些數(shù)值給刪除掉韭赘,刪除后剩余5668個觀測記錄和30個變量。

五势就、數(shù)據(jù)分析:

1)泉瞻、分析各區(qū)與房價之間的關(guān)系:按區(qū)分類脉漏、各區(qū)住房量、各區(qū)均價袖牙。

通過觀察數(shù)據(jù):實際交易價格和每平米單價的變化基本上是一致的侧巨,距離城區(qū)越近的價格越高基本上是成正比的。西城贼陶、東城刃泡、海淀巧娱、朝陽的房價較高碉怔,門頭溝、房山禁添、懷柔撮胧、平谷房價較低,這說明越接近市中心的房價越高老翘。

2)芹啥、分析房屋大小與房價的關(guān)系

通過觀察數(shù)據(jù):我們可以發(fā)現(xiàn)房屋面積和成交價格成長尾分布,價格隨著面結(jié)的增大而增大铺峭。從成交數(shù)量上看墓怀,成交的房屋主要集中在房屋面積為80~100平米,隨著面積的增大卫键,每平米的均價也相對的在降低傀履,說明面積和價格成反比,通過進一步觀察莉炉,發(fā)現(xiàn)造成這種現(xiàn)象的主要是因為受離城區(qū)的距離影響钓账。

3)、接下來我們看看哪些戶型最受市場歡迎絮宁。

這里我們發(fā)現(xiàn)兩室一廳一廚一衛(wèi)和一室一廳一廚一衛(wèi)的戶型比較受市場歡迎梆暮,而隨著庭室的增多交易數(shù)量相應(yīng)的減少,這也說明了這些戶型是屬于人們生活的剛需绍昂,而房屋單價高啦粹,面積大占用的資金就會多,對于現(xiàn)在我國的發(fā)展水平而言也是哈符合實際的窘游,有錢的先對來說還是少數(shù)的唠椭。

4)、分析房屋價格與裝修類型的關(guān)系

從成交數(shù)量上看有電梯的偏多且有電梯的價格也相對偏高张峰,但是價格差距不是很明顯泪蔫。

房屋價格與建筑年代

從圖上可以觀察2000年之后的交易房屋比較多,而年代越久數(shù)量相對較少喘批。

年代較久遠的建筑用房價格相對較貴一點撩荣,為什么老房子反而比新房子價格要高吶铣揉,查看了數(shù)據(jù)發(fā)現(xiàn)年代較早的樓層數(shù)比較低,有可能跟拆遷有關(guān)系.

六餐曹、總結(jié):

通過上邊的分析我們發(fā)現(xiàn)影響價格的關(guān)系主要跟距離市中心的距離和建筑年代關(guān)系比較密切和電梯和裝修情況的關(guān)系不是很明顯逛拱,同時兩室一廳一廚一衛(wèi)和一室一廳一廚一衛(wèi)的戶型比較受大家的喜歡,這個跟經(jīng)濟狀況台猴、家庭成員總數(shù)有一定的關(guān)系朽合。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市饱狂,隨后出現(xiàn)的幾起案子曹步,更是在濱河造成了極大的恐慌,老刑警劉巖休讳,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件讲婚,死亡現(xiàn)場離奇詭異,居然都是意外死亡俊柔,警方通過查閱死者的電腦和手機筹麸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來雏婶,“玉大人物赶,你說我怎么就攤上這事×敉恚” “怎么了酵紫?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長倔丈。 經(jīng)常有香客問我憨闰,道長,這世上最難降的妖魔是什么需五? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任鹉动,我火速辦了婚禮,結(jié)果婚禮上宏邮,老公的妹妹穿的比我還像新娘泽示。我一直安慰自己,他們只是感情好蜜氨,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布械筛。 她就那樣靜靜地躺著,像睡著了一般飒炎。 火紅的嫁衣襯著肌膚如雪埋哟。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機與錄音赤赊,去河邊找鬼闯狱。 笑死,一個胖子當著我的面吹牛抛计,可吹牛的內(nèi)容都是我干的哄孤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼吹截,長吁一口氣:“原來是場噩夢啊……” “哼瘦陈!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起波俄,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤晨逝,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后弟断,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咏花,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年阀趴,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片苍匆。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡刘急,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出浸踩,到底是詐尸還是另有隱情叔汁,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布检碗,位于F島的核電站据块,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏折剃。R本人自食惡果不足惜另假,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望怕犁。 院中可真熱鬧边篮,春花似錦、人聲如沸奏甫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阵子。三九已至思杯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間挠进,已是汗流浹背色乾。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工腾么, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人杈湾。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓解虱,卻偏偏與公主長得像,于是被迫代替她去往敵國和親漆撞。 傳聞我的和親對象是個殘疾皇子殴泰,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容