數(shù)據(jù)來源:python 爬取的鏈家官網(wǎng)二手房交易數(shù)據(jù)
數(shù)據(jù)量:有效數(shù)據(jù)約30萬條响委,包含信息:'行政區(qū)','片區(qū)', '小區(qū)', '格局', '面積', '樓層', '建成年代', '建成年', '樓體結(jié)構(gòu)', '成交時(shí)間', '成交年', '成交月', '成交金額', '平米價(jià)', '朝向', '裝修', '有無電梯
先來看看基本描述
數(shù)據(jù)來源于鏈家2010年到2018年的數(shù)據(jù)恰梢,一個(gè)比較基本的概念是:
近幾年成交均價(jià)是380萬藻烤,平米均價(jià)是4萬8。到了2018年5月爽雄,成交均價(jià)……平米價(jià)格。想提醒剛畢業(yè)的新社會(huì)人:如果想將來在北京安家落戶沐鼠,還得考慮下這個(gè)門檻挚瘟。
成交量by 行政區(qū)
代碼中間那兩行是為了修正 matplotlib顯示中文的問題,這個(gè)上一篇文章講過饲梭。
圖表看出大朝陽成交量最大乘盖;其次是海淀,緊接著是豐臺(tái)憔涉,這點(diǎn)比較意外订框。接著是學(xué)區(qū)房重地西城區(qū)。
各年房價(jià)走勢(shì):
python這一點(diǎn)很糟糕兜叨,print出來的結(jié)果小數(shù)位數(shù)大穿扳,而且字段多了無法容納,很難觀察數(shù)據(jù)国旷。我想出來的解決辦法是存儲(chǔ)結(jié)果之后重新讀取作圖矛物。
先看朝陽區(qū)的均價(jià),在2017年達(dá)到高峰后跪但,2018年履羞,的確是降了,但依降得不多屡久。
看全市
此時(shí)再次眼花忆首。區(qū)域太多,顏色有限被环,都快分不清豐臺(tái)和西城的顏色糙及,差點(diǎn)誤以為豐臺(tái)的均價(jià)最高位。
那就中心城區(qū)和衛(wèi)星城分開看好了
干凈蛤售。
我們看到最核心這幾個(gè)區(qū)域丁鹉,西城東城海淀分別占據(jù)成交均價(jià)前三位妒潭,他們都在2015-2017年有著瘋狂的漲幅。學(xué)區(qū)房重地西城的交易均價(jià)在2017年超過10萬/平揣钦。
再看第二梯隊(duì)和第三梯隊(duì):
門頭溝區(qū)在2015-2017房價(jià)瘋漲期間居然比第三梯隊(duì)其他三個(gè)區(qū)漲幅都快雳灾,當(dāng)然2017年之后,跌幅也更大(看斜率)
回到題目的疑問:降了冯凹,降得不多谎亩,后續(xù)會(huì)分析2018年的走勢(shì)。
待續(xù)……