浩彬老撕曾經(jīng)在《IBM SPSS Modeler最強(qiáng)工具書收藏系列(四)-數(shù)據(jù)讀取奧秘》中提到怎么利用spss讀取各種來源的數(shù)據(jù)纺酸,其中也重點介紹了如何通過odbc讀取數(shù)據(jù)庫數(shù)據(jù)壹置。
考慮到數(shù)據(jù)庫的數(shù)據(jù)讀取相比于其他數(shù)據(jù)復(fù)雜腿堤,本文將進(jìn)一步給大家介紹SPSS Modeler與數(shù)據(jù)的鏈接問題湃鹊。
本文將使用1月份廣州地區(qū)某移動監(jiān)測站點PM2.5數(shù)據(jù)作為示例(該數(shù)據(jù)僅作示例使用瞎访,并非真實數(shù)據(jù))。如果你對如何通過odbc鏈接讀取數(shù)據(jù)庫還有疑問請查看如下內(nèi)容:
整個數(shù)據(jù)流如下圖所示:
1數(shù)據(jù)庫源節(jié)點,使用SQL查詢
在前面,我們介紹了如何讀取整個表格的數(shù)據(jù)茎用,但是在實際項目當(dāng)中,可能由于數(shù)據(jù)量較大或者我們只需要其中的部分?jǐn)?shù)據(jù),那么直接全表讀取就顯得低效了绘搞。
在【數(shù)據(jù)庫源節(jié)點】中彤避,我們可以進(jìn)一步使用SQL查詢數(shù)據(jù),只需要在“模式”中選擇“SQL查詢”即可:
當(dāng)然夯辖,考慮到用戶方便琉预,我們可以直接導(dǎo)入缺省值,并在缺省值上直接進(jìn)行修改:
這里我們重新修改一下語句蒿褂,選擇廣州白云區(qū)的PM2.5數(shù)據(jù)進(jìn)行查詢:
select
date_time,
zone,
pm25
from d.gz_pm25
where zone = '白云區(qū)'
讀取后接入表格節(jié)點圆米,查看數(shù)據(jù)。
2數(shù)據(jù)庫導(dǎo)出節(jié)點啄栓,使用SQL建表
要將數(shù)據(jù)導(dǎo)回數(shù)據(jù)庫當(dāng)中娄帖,我們可以使用導(dǎo)出選項卡中的【數(shù)據(jù)庫】節(jié)點。
值得注意的是昙楚,由于我們是要建表近速,除了按照Modeler默認(rèn)建表設(shè)置外,我們還可以進(jìn)一步指定堪旧,在【導(dǎo)出】節(jié)點中削葱,選擇模式,將進(jìn)一步設(shè)定建表的內(nèi)容淳梦。在模式中析砸,除了可以使用定制的creat table命令外,我們依然可以通過圖形化界面的方式定義主鍵和字段的類型爆袍。
設(shè)定完成后首繁,點擊運(yùn)行,即可完成數(shù)據(jù)的導(dǎo)出陨囊。