大數(shù)據(jù)、數(shù)據(jù)挖掘和機器學習概念

可以認為大數(shù)據(jù)谎柄、數(shù)據(jù)挖掘和機器學習是三個平行的概念丁侄。大數(shù)據(jù)側(cè)重描述數(shù)據(jù),數(shù)據(jù)挖掘側(cè)重描述應用朝巫,機器學習側(cè)重描述方法鸿摇。當然唤锉,數(shù)據(jù)是基礎遂跟,是挖掘和學習的“燃料”(Ng說深度學習像火箭,計算是引擎,數(shù)據(jù)是燃料)糙臼。

大數(shù)據(jù)的內(nèi)涵,是從數(shù)據(jù)量恩商、數(shù)據(jù)類型和數(shù)據(jù)增長速度的角度描述數(shù)據(jù)变逃。由于這些特點,數(shù)據(jù)的存儲怠堪、傳輸揽乱、計算、處理粟矿、分析等凰棉,都是傳統(tǒng)方式難以應對的,相關(guān)的技術(shù)就要升級陌粹,新的技術(shù)棧通橙鱿基于分布式架構(gòu)解決,而分布式架構(gòu)又帶來一致性掏秩、資源調(diào)度或舞、性能優(yōu)化等多種問題,由此批處理蒙幻、流計算映凳、圖計算、即席查詢等方向都有發(fā)展邮破。

數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中挖掘出有價值的潛藏規(guī)律和知識诈豌。數(shù)據(jù)挖掘渴望完整而真實的原始數(shù)據(jù)仆救,去噪和樣本平衡很重要。實施過程涉及機器學習矫渔、模式識別派桩、統(tǒng)計學、分布式存儲蚌斩、分布式計算铆惑、可視化等,還需要掌握領(lǐng)域?qū)I(yè)知識送膳。

機器學習是從數(shù)據(jù)中獲取經(jīng)驗進而改善系統(tǒng)性能的一類重要方法员魏,“學習”的意義就是求解最逼近真相的經(jīng)驗,理論基礎主要是統(tǒng)計學叠聋。數(shù)據(jù)挖掘經(jīng)常需要采用機器學習方法撕阎,但目前機器學習主要是想實現(xiàn)某種程度的人工智能。

編輯于 2017-09-08

轉(zhuǎn)自知乎


數(shù)據(jù)挖掘碌补、機器學習虏束、深度學習這些概念有區(qū)別嗎?

添加一個了解的角度:數(shù)據(jù)挖掘概念火爆的時候厦章,數(shù)據(jù)倉庫正當家镇匀。機器學習是隨著大數(shù)據(jù)概念為人熟知的。深度學習是神經(jīng)網(wǎng)絡算法的新近發(fā)展袜啃,是隨著機器學習概念被廣知的汗侵。 數(shù)據(jù)挖掘作為一眾數(shù)據(jù)分析技術(shù)的統(tǒng)稱,出現(xiàn)較早群发。彼時有余數(shù)據(jù)庫處理能力局限等原因晰韵,強調(diào)從抽樣數(shù)據(jù)出發(fā)分析數(shù)據(jù)全集。 機器學習嚴格來說與數(shù)據(jù)挖掘不是對等概念熟妓,仍屬于數(shù)據(jù)挖掘范疇雪猪。只不過更多地基于大數(shù)據(jù)理念出發(fā),直接在數(shù)據(jù)全集中進行分析起愈,故而有“…

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末只恨,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子告材,更是在濱河造成了極大的恐慌坤次,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,858評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件斥赋,死亡現(xiàn)場離奇詭異缰猴,居然都是意外死亡,警方通過查閱死者的電腦和手機疤剑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評論 3 395
  • 文/潘曉璐 我一進店門滑绒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來闷堡,“玉大人,你說我怎么就攤上這事疑故「芾溃” “怎么了?”我有些...
    開封第一講書人閱讀 165,282評論 0 356
  • 文/不壞的土叔 我叫張陵纵势,是天一觀的道長踱阿。 經(jīng)常有香客問我,道長钦铁,這世上最難降的妖魔是什么软舌? 我笑而不...
    開封第一講書人閱讀 58,842評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮牛曹,結(jié)果婚禮上佛点,老公的妹妹穿的比我還像新娘。我一直安慰自己黎比,他們只是感情好超营,可當我...
    茶點故事閱讀 67,857評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著阅虫,像睡著了一般演闭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上书妻,一...
    開封第一講書人閱讀 51,679評論 1 305
  • 那天船响,我揣著相機與錄音,去河邊找鬼躲履。 笑死,一個胖子當著我的面吹牛聊闯,可吹牛的內(nèi)容都是我干的工猜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼菱蔬,長吁一口氣:“原來是場噩夢啊……” “哼篷帅!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起拴泌,我...
    開封第一講書人閱讀 39,311評論 0 276
  • 序言:老撾萬榮一對情侶失蹤魏身,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后蚪腐,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體箭昵,經(jīng)...
    沈念sama閱讀 45,767評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年回季,在試婚紗的時候發(fā)現(xiàn)自己被綠了家制。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片正林。...
    茶點故事閱讀 40,090評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖颤殴,靈堂內(nèi)的尸體忽然破棺而出觅廓,到底是詐尸還是另有隱情,我是刑警寧澤涵但,帶...
    沈念sama閱讀 35,785評論 5 346
  • 正文 年R本政府宣布杈绸,位于F島的核電站,受9級特大地震影響矮瘟,放射性物質(zhì)發(fā)生泄漏瞳脓。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,420評論 3 331
  • 文/蒙蒙 一芥永、第九天 我趴在偏房一處隱蔽的房頂上張望篡殷。 院中可真熱鬧,春花似錦埋涧、人聲如沸板辽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽劲弦。三九已至,卻和暖如春醇坝,著一層夾襖步出監(jiān)牢的瞬間邑跪,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評論 1 271
  • 我被黑心中介騙來泰國打工呼猪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留画畅,地道東北人。 一個月前我還...
    沈念sama閱讀 48,298評論 3 372
  • 正文 我出身青樓宋距,卻偏偏與公主長得像轴踱,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子谚赎,可洞房花燭夜當晚...
    茶點故事閱讀 45,033評論 2 355

推薦閱讀更多精彩內(nèi)容