概述
在上一期中衡楞,我們抓取了新聞數(shù)據(jù)吱雏,現(xiàn)在我們要通過GoldData融合到兩張數(shù)據(jù)庫表news_site和news表當(dāng)中去。如下圖所示:
我們很容易看到這兩張表存在關(guān)聯(lián)瘾境,那是怎樣將數(shù)據(jù)寫入關(guān)聯(lián)呢歧杏,我們將接上一期在此一一介紹。
定義融合映射
數(shù)據(jù)集news ==> 表news_site
在“融合管理”中迷守,選擇數(shù)據(jù)集"news",選擇數(shù)據(jù)庫表news_site點(diǎn)擊“添加”按扭得滤,然后再點(diǎn)擊“編輯映射”。如下圖所示:
關(guān)聯(lián)數(shù)據(jù)方式選擇“關(guān)聯(lián)字段”盒犹,關(guān)聯(lián)表字段"name",關(guān)聯(lián)數(shù)據(jù)集JS為“dataset.source”懂更,然后選擇“保存”即可。
news_site表有兩個字段:一個是id字段急膀,由于是自增長字段沮协,所以不用關(guān)聯(lián);另一個是name字段,選擇映謝方式為“數(shù)據(jù)集字段”卓嫂,而內(nèi)容是來自于數(shù)據(jù)集news的source字段慷暂。
手動作業(yè)
我們回到“融合管理”頁面,點(diǎn)擊“融合作業(yè)”晨雳,然后點(diǎn)擊“手動作業(yè)”行瑞,打開“手動作業(yè)”子頁面,如下圖所示:
在這里我們可以看到融合是沒問題的餐禁。點(diǎn)擊“提交且下一條”血久,則會將合并結(jié)果寫入到數(shù)據(jù)庫表當(dāng)中。如下圖所示:
然后回到“融合作業(yè)”子頁面帮非,點(diǎn)擊“開始融合”氧吐,將會開始自動融合。如下圖所示:
系統(tǒng)就將會將數(shù)據(jù)集的數(shù)據(jù)按照指定的規(guī)則進(jìn)行一個個的融合了末盔。
數(shù)據(jù)集news ==> 表news
在“融合管理”中筑舅,選擇數(shù)據(jù)集"news",選擇數(shù)據(jù)庫表news點(diǎn)擊“添加”按扭,然后再點(diǎn)擊“編輯映射”陨舱。如下圖所示:
關(guān)聯(lián)數(shù)據(jù)方式選擇“不關(guān)聯(lián)翠拣,數(shù)據(jù)追加”,這將意味著數(shù)據(jù)集里的新數(shù)據(jù)將會追加到表news新記錄里游盲,但當(dāng)然老數(shù)據(jù)不會追加為news新記錄里误墓,也就是多次反復(fù)融合也不會在表news里產(chǎn)生重復(fù)數(shù)據(jù)邦尊。
對于字段映射,說明如下:
字段說明
id自增長优烧,不用映射
title直接映射為數(shù)據(jù)集字段title
pub_date使用JS 將數(shù)據(jù)集字段pubdate內(nèi)容添加:00即可
site_id映射表news_site蝉揍,通過數(shù)據(jù)集字段source查找得到id
content直接映射為數(shù)據(jù)集字段content
date_created用JS創(chuàng)建該值即可
手動作業(yè)
我們回到“融合管理”頁面,點(diǎn)擊“融合作業(yè)”畦娄,然后點(diǎn)擊“手動作業(yè)”又沾,打開“手動作業(yè)”子頁面,如下圖所示:
確認(rèn)正確無誤熙卡,點(diǎn)擊“提交且下一條”杖刷,數(shù)據(jù)將會寫入數(shù)據(jù)庫中。如下圖所示:
然后回到“融合作業(yè)”子頁面驳癌,點(diǎn)擊“開始融合”滑燃,將會開始自動融合。
結(jié)語
通過GoldData后颓鲜,我們很容易將數(shù)據(jù)及數(shù)據(jù)之間關(guān)系融合到關(guān)系數(shù)據(jù)庫表中表窘。接下來我們還介紹自關(guān)聯(lián)數(shù)據(jù)的融合。