一孝常、大數(shù)據(jù)前世今生
當下大數(shù)據(jù)時代已經(jīng)來臨旗们,數(shù)據(jù)越來越成為公司的核心資產(chǎn)和主要競爭力,核心業(yè)務以及決策都需要數(shù)據(jù)來支撐构灸。不懂大數(shù)據(jù)和機器學習的話上渴,你可能連最基本的產(chǎn)品邏輯和商業(yè)意圖都搞不清楚,那么你只能做一個沒有思想的碼農(nóng)喜颁,無法實現(xiàn)人生躍遷稠氮。
今天我們常說的大數(shù)據(jù),是由谷歌的三篇論文奠定的半开,就是廣為人知的”三架馬車“:分布式文件系統(tǒng)GFS隔披、分布式計算框架MapReduce、NOSQL數(shù)據(jù)庫系統(tǒng)BigTable寂拆。隨機業(yè)務需求的倒逼與技術的迭代奢米,大數(shù)據(jù)日趨成熟,演進的大數(shù)據(jù)架構(gòu)如下圖所示
二纠永、大數(shù)據(jù)的應用發(fā)展
1鬓长、大數(shù)據(jù)搜索引擎時代
谷歌為了解決網(wǎng)頁數(shù)據(jù)的存儲、索引尝江、詞頻統(tǒng)計等需求而研發(fā)的分布式存儲系統(tǒng)以及分布式計算框架涉波。
2、大數(shù)據(jù)數(shù)據(jù)倉庫時代
數(shù)據(jù)倉庫時代茂装,只要有數(shù)據(jù)怠蹂,那么必須要用到統(tǒng)計分析,面對日趨龐大數(shù)據(jù)少态,Hadoop大數(shù)據(jù)技術就被廣泛應用
3城侧、大數(shù)據(jù)應用的數(shù)據(jù)挖掘時代
隨著大數(shù)據(jù)應用的不斷深化,我們對數(shù)據(jù)有了更多的要求彼妻,需要挖掘出數(shù)據(jù)間的關聯(lián)以及規(guī)律等有價值的信息嫌佑,輔助商業(yè)決策。比如某大型購物中心侨歉,通過大數(shù)據(jù)分析出人們付款時候最喜歡隨手拿的商品屋摇,那么我們可以把這些商品布局在收銀旁邊,提高了購買率幽邓。比如針對用戶畫像炮温,為用戶量身打造的推薦系統(tǒng)。比如當下的今日頭條牵舵、抖音等產(chǎn)品柒啤,也是使用了數(shù)據(jù)挖掘技術倦挂,推薦給你最想看的內(nèi)容。
4担巩、大數(shù)據(jù)機器學習時代
利用大數(shù)據(jù)技術把歷史全量數(shù)據(jù)收集起來方援,統(tǒng)計其規(guī)律,用于對未來趨勢的預測涛癌,這就是機器學習犯戏。
三、大數(shù)據(jù)的應用領域
依賴于人的經(jīng)驗的領域拳话,理論上可以用大數(shù)據(jù)與機器學習進行升級先匪。
四、總結(jié)
了解大數(shù)據(jù)與機器學習是我們未來的必修課假颇,可以幫助你了解科技社會生活的變遷胚鸯,本次是第一篇文章,講解了大數(shù)據(jù)的發(fā)展以及應用笨鸡,后續(xù)會有一系列的文章,幫助大家對大數(shù)據(jù)有一個全局的認知坦冠,感興趣的朋友形耗,持續(xù)關注我,謝謝辙浑!