1. 寫在前面


使用KNIME的時(shí)間一年多一點(diǎn)混聊,對(duì)工作的效率的幫助非常大(主要是懶弹谁,不希望做重復(fù)性的工作,希望多騰些時(shí)間出來(lái)刷刷知乎句喜,逛逛論壇)预愤。通過(guò)這個(gè)專題,逐步分享關(guān)于KNIME的點(diǎn)滴咳胃,能讓大家的工作起來(lái)更加從容植康。

數(shù)據(jù)分析工具很多,工具語(yǔ)言如R展懈, Python销睁,工具類的如rapiderminer, alteryx 供璧,weka以及我們重點(diǎn)介紹的KNIME。還有很多工具和語(yǔ)言在此就不一一列舉了冻记。如果你像筆者一樣只是工作中有部分(< 30%)工作需要用到數(shù)據(jù)睡毒,比如業(yè)績(jī)追蹤管理,那可以用工具類的語(yǔ)言解決檩赢。如果你的工作90%以上都是數(shù)據(jù)吕嘀,靠這個(gè)吃飯的,那建議你還是靜下心來(lái)好好學(xué)習(xí)一門編程語(yǔ)言R or Python贞瞒。



為什么要用KNIME偶房?


1. 如果你不想寫代碼,或者說(shuō)不會(huì)寫军浆,但在自己的知識(shí)體系中曾經(jīng)學(xué)過(guò)C棕洋,VB,即最基礎(chǔ)的大學(xué)或研究生那點(diǎn)編程語(yǔ)言乒融,還是針對(duì)非計(jì)算機(jī)專業(yè)的掰盘。盡管現(xiàn)在都基本還給的老師,但至少知道if語(yǔ)句赞季,那說(shuō)明你可以用工具類語(yǔ)言愧捕。

2. KNIME相比于Rapidminer,Alteryx是免費(fèi)的申钩,當(dāng)然有些特定情況除外.

3. 想嘗試現(xiàn)在比較火的人工智能次绘,部署監(jiān)督/無(wú)監(jiān)督學(xué)習(xí)模型,KNIME上面有很多現(xiàn)成的模型足夠調(diào)用撒遣。

類似你想給你的車買合適的輪胎邮偎,輪胎廠家會(huì)提供輪胎使用的邊界條件,你不必知道輪胎內(nèi)部的高分子物理化學(xué)推導(dǎo)過(guò)程义黎。

KNIME也是一樣禾进,每個(gè)模型都會(huì)提供輸入和輸出。但需要知道這些條件對(duì)模型的影響廉涕,以及模型使用的前提(基本wiki后就可以有個(gè)大概認(rèn)識(shí))泻云,就像你不會(huì)給自己的轎車買一個(gè)卡車胎一樣的道理。

也許有可能成為一個(gè)“調(diào)參俠”火的,但還是再次強(qiáng)調(diào)如果你是靠數(shù)據(jù)吃飯壶愤,還是老老實(shí)實(shí)的把各種知識(shí)儲(chǔ)備弄扎實(shí)了。

4. 以下一些典型的場(chǎng)景馏鹤,如果你的工作涉及到了,說(shuō)明你可以繼續(xù)關(guān)注后面筆者的分享:

??????????? 1) 你肩負(fù)匯總和評(píng)價(jià)下屬分公司的業(yè)績(jī)娇哆,而這些業(yè)績(jī)都是基于EXCEL的湃累。對(duì)于宏操作不會(huì)勃救,只能通過(guò)復(fù)制粘貼,或者超鏈接的等于功能把在一個(gè)文件夾的文件匯總到一個(gè)文件上治力。

?????????? 2) 你有公司數(shù)據(jù)庫(kù)訪問(wèn)權(quán)限蒙秒,但你的SQL水平僅限于select * from XXX 最多加一個(gè)where,groupby宵统,top或者對(duì)select的字段進(jìn)行簡(jiǎn)單的邏輯計(jì)算(求和晕讲,最大,字符串)马澈。 你后續(xù)的處理通過(guò)Tableau瓢省, PowerBI一類的展示工具,但由于數(shù)據(jù)源的結(jié)構(gòu)限制痊班,影響你要呈現(xiàn)的內(nèi)容勤婚。比如,你要針對(duì)公司CRM 進(jìn)行RFM進(jìn)行分析涤伐,時(shí)間截點(diǎn)以今天往前推60天馒胆,看這個(gè)時(shí)間段內(nèi)每個(gè)會(huì)員的總交易額,交易頻次凝果,最后一次交易距離今天有多長(zhǎng)時(shí)間祝迂,通過(guò)KNIME可以輕松的把這個(gè)三個(gè)指標(biāo)跑出來(lái),并跟在會(huì)員ID后面器净,下面才是EXCEL型雳, Tableau 或者PowerBI上場(chǎng)。

????????? 3) 你作為業(yè)務(wù)部門給IT部門提出需求掌动,需要XXX類型數(shù)據(jù)四啰,但I(xiàn)T部門事務(wù)繁多,常常無(wú)法及時(shí)響應(yīng)

?????????? 4) 你有通過(guò)模型去實(shí)現(xiàn)預(yù)測(cè)或者發(fā)現(xiàn)關(guān)系的需求粗恢。比如柑晒,通過(guò)Apriori 算法計(jì)算購(gòu)物籃商品的關(guān)聯(lián)度,從而去優(yōu)化你們的促銷組合

?????????? 5) 數(shù)據(jù)挖掘和統(tǒng)計(jì)眷射,主要涉及以下方法



????????? 6)? 還有很多場(chǎng)景匙赞,但筆者工作不涉及,比如妖碉,爬蟲爬twitter或其他然后針對(duì)語(yǔ)義分析涌庭;化學(xué)分子式的分析;

????????? 7) 下圖是KNIME官方給一些應(yīng)用場(chǎng)景欧宜,如果下面有你關(guān)注的案例沟沙,那不妨了解一下


總之,這是一個(gè)針對(duì)非碼農(nóng)的搞數(shù)據(jù)的好工具路星。

后續(xù)的分享,筆者會(huì)沿用德國(guó)人的思路匹中,通過(guò)案例實(shí)踐來(lái)學(xué)習(xí)。大家可以在案例基礎(chǔ)上豪诲,修改成符合自己使用場(chǎng)景的工具顶捷。若有問(wèn)題,可以向筆者咨詢屎篱。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末服赎,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子交播,更是在濱河造成了極大的恐慌重虑,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件堪侯,死亡現(xiàn)場(chǎng)離奇詭異嚎尤,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)伍宦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門芽死,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人次洼,你說(shuō)我怎么就攤上這事关贵。” “怎么了卖毁?”我有些...
    開封第一講書人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵揖曾,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我亥啦,道長(zhǎng)炭剪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任翔脱,我火速辦了婚禮奴拦,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘届吁。我一直安慰自己错妖,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開白布疚沐。 她就那樣靜靜地躺著暂氯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪亮蛔。 梳的紋絲不亂的頭發(fā)上痴施,一...
    開封第一講書人閱讀 51,727評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼晾剖。 笑死锉矢,一個(gè)胖子當(dāng)著我的面吹牛梯嗽,可吹牛的內(nèi)容都是我干的齿尽。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼灯节,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼循头!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起炎疆,我...
    開封第一講書人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤卡骂,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后形入,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體全跨,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年亿遂,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了浓若。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蛇数,死狀恐怖挪钓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情耳舅,我是刑警寧澤碌上,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站浦徊,受9級(jí)特大地震影響馏予,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜盔性,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一霞丧、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧纯出,春花似錦蚯妇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至焕襟,卻和暖如春陨收,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工务漩, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留拄衰,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓饵骨,卻偏偏與公主長(zhǎng)得像翘悉,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子居触,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 為什么要寫這個(gè)系列文章 支付是商業(yè)變現(xiàn)必不可少的環(huán)節(jié)妖混,而每個(gè)公司,因?yàn)闃I(yè)務(wù)形態(tài)并不太一樣轮洋,導(dǎo)致開發(fā)的支付系統(tǒng)不盡相...
    金融民工小曾閱讀 538評(píng)論 0 3
  • (一)為什么需要集合制市? 因?yàn)閿?shù)組無(wú)法滿足需求。 1弊予,數(shù)組長(zhǎng)度不可變我們可以用數(shù)組保存基本數(shù)據(jù)類型和引用類型祥楣,但是數(shù)...
    Michael_748c閱讀 315評(píng)論 0 0
  • 隨著當(dāng)今科技和信息時(shí)代的發(fā)展,作為一名生涯規(guī)劃師究竟面臨什么樣的挑戰(zhàn)汉柒?在正式開課前與美國(guó)其他領(lǐng)域的生涯規(guī)劃師討論了...
    貓眼看生涯閱讀 187評(píng)論 0 1
  • 作者:shihuaping0918@163.com误褪,轉(zhuǎn)載請(qǐng)注明作者 pomelo是大黃易開源的一個(gè)游戲框架,老外也...
    天一閣圖書管理員閱讀 1,642評(píng)論 0 0
  • 在今年在我們中國(guó)有很多很多很神奇的事物出現(xiàn)竭翠,都是些很新鮮的事物振坚,但是其中最新鮮的呢? 莫過(guò)于電競(jìng)學(xué)校這一個(gè)嶄新的門...
    黃銅刀閱讀 2,025評(píng)論 1 0