因?yàn)檎撐男枰幚砬f級(jí)別的數(shù)據(jù),之前一直用python讀取數(shù)據(jù),經(jīng)過data manipulation把數(shù)據(jù)量減小,再做分析也拜,但是中途會(huì)把很多實(shí)驗(yàn)結(jié)果生成的表存儲(chǔ)在電腦里,雖然做了文件夾分類趾痘,但是依然為文件命名和存儲(chǔ)位置感到頭疼慢哈。
實(shí)習(xí)開始接觸了數(shù)據(jù)挖掘工具KNIME,之前寫過一篇KNIME的基本介紹:數(shù)據(jù)分析工具KNIME基礎(chǔ)模塊及特點(diǎn)分析 - 簡書永票,在使用過程中用KNIME可以自由連接公司數(shù)據(jù)庫進(jìn)行取數(shù)卵贱,再運(yùn)用當(dāng)中的Node做更多后續(xù)分析滥沫。當(dāng)時(shí)就認(rèn)識(shí)到KNIME 連數(shù)據(jù)庫的功能是很強(qiáng)大的,甚至由于其他數(shù)據(jù)分析/挖掘產(chǎn)品键俱,比如Rapidminer和Tableau兰绣。在這里也給自己挖個(gè)坑,之后會(huì)寫一篇KNIME的數(shù)據(jù)連接功能编振。
雖然KNIME可以解決數(shù)據(jù)處理過程中重復(fù)操作的問題缀辩,但是每次進(jìn)行數(shù)據(jù)導(dǎo)入依然存在數(shù)據(jù)來源多,文件混亂這樣的問題踪央。偽男友阿康向我推薦了PostgreSQL臀玄,我用兩天時(shí)間在Mac上成功配置了環(huán)境并且把數(shù)據(jù)分析用的shp文件和csv都導(dǎo)入了進(jìn)來。
選擇PostgreSQL的原因是處理的數(shù)據(jù)主要是地理空間數(shù)據(jù)畅蹂,而pgSQL剛好有postgis的拓展功能健无,可以很好的存儲(chǔ)有空間屬性的數(shù)據(jù),據(jù)說還有很多很強(qiáng)大的功能我還沒有發(fā)覺液斜,但是我已經(jīng)嘗試了多種數(shù)據(jù)導(dǎo)入方法累贤,甚至可以從QGIS里直接把shp拖拽進(jìn)數(shù)據(jù)庫,還是挺讓人激動(dòng)的旗唁。
下載Postgres app
與windows下載PostgreSQL不同畦浓,我在搜索Mac的pgSQL版本時(shí)發(fā)現(xiàn)了Postgres app:Postgres.app – the easiest way to get started with PostgreSQL on the Mac,據(jù)說是在Mac上使用pgSQL的最簡單方式检疫,直接到鏈接網(wǎng)站里面下載,下載結(jié)束之后找到dmg文件祷嘶,像安裝任何一個(gè)app一樣install即可屎媳,然后把圖標(biāo)拖入文件夾,小象圖標(biāo)就會(huì)出現(xiàn)在你的app列表里了(右下角)论巍。
隨即打開應(yīng)用烛谊,出現(xiàn)如圖所示界面。在下載之初自動(dòng)建立了以你電腦用戶名為名字和以postgres為名字的兩個(gè)數(shù)據(jù)庫(請忽略一左一右兩個(gè)database嘉汰,是我自己后來創(chuàng)建的)丹禀,postgres也提供了創(chuàng)建新身份和切換身份的方法。
這里點(diǎn)擊任何一個(gè)數(shù)據(jù)庫即可進(jìn)入到相應(yīng)的terminal執(zhí)行語句鞋怀∷幔可以先輸入help獲取幫助。
下載pgAdmin
因?yàn)楸救颂肆嗣芩疲妹钚羞M(jìn)行數(shù)據(jù)庫操作較為困難焙矛,這時(shí)候就輪到Postgres app的好朋友pgAdmin出場了。pgAdmin提供圖形化操作界面残腌,與pgSQL的關(guān)系就好像Navicat或HeidiSQL與MySQL的關(guān)系一樣村斟,方便對(duì)數(shù)據(jù)庫進(jìn)行操作贫导。下載去這里:pgAdmin - PostgreSQL Tools,直接找到macOS版本蟆盹,這時(shí)候不要費(fèi)解孩灯,只下載dmg結(jié)尾的文件即可(中間的)。
下載完成后也是點(diǎn)擊安裝逾滥,然后雙擊圖標(biāo)钱反,網(wǎng)頁版界面映入眼簾。
完成? 環(huán)境配置好了匣距,在數(shù)據(jù)的天地中盡情馳騁吧面哥!手比哈特!