0. 總結(jié)目錄
1. 背景
?根據(jù)IBM前首席執(zhí)行官郭士納的觀(guān)點(diǎn),IT領(lǐng)域每隔十五年就會(huì)迎來(lái)一次重大變革
(我個(gè)人覺(jué)得第四次浪潮可能是人工智能和去中心化區(qū)塊鏈)
2. 大數(shù)據(jù)的概念
大數(shù)據(jù)不僅僅是數(shù)據(jù)的大量化班巩,而是包含快速化满着,多樣化和價(jià)值化等多重屬性慷垮。
2.1 數(shù)據(jù)量大;人類(lèi)在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量
2.2 數(shù)據(jù)種類(lèi)繁多,只有10%是結(jié)構(gòu)化數(shù)據(jù)否淤,存儲(chǔ)在數(shù)據(jù)庫(kù)中;90%是非結(jié)構(gòu)化數(shù)據(jù)棠隐,它們與人類(lèi)信息密切相關(guān)石抡。
2.3 處理速度快:
a) 從數(shù)據(jù)的生成到消耗時(shí)間,窗口非常小助泽,可用于生成決策的時(shí)間十分少啰扛。
b) 一秒定律,這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同.
2.4 價(jià)值密度低报咳,商業(yè)價(jià)值高:以視頻為例侠讯,連續(xù)不斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅是一兩秒暑刃,但是具有很高的商業(yè)價(jià)值厢漩。
3. 大數(shù)據(jù)的影響
- 在科學(xué)研究上,先后歷經(jīng)了實(shí)驗(yàn)岩臣、理論溜嗜、計(jì)算和數(shù)據(jù)四種范式
在思維方式方面,大數(shù)據(jù)完全顛覆了傳統(tǒng)的思維方式:
–全樣而非抽樣
–效率而非精確
–相關(guān)而非因果個(gè)人感想:
大數(shù)據(jù)可能會(huì)影響到生活中的每一個(gè)方面架谎,因?yàn)闊o(wú)論是機(jī)器學(xué)習(xí)炸宵,或是人工智能,算法的準(zhǔn)確性上升主要是因?yàn)閿?shù)據(jù)量上升谷扣。在大數(shù)據(jù)真正應(yīng)用后土全,科學(xué)不再像以前那樣是先提出問(wèn)題捎琐,然后再去驗(yàn)證;而是反過(guò)來(lái)裹匙,而是從大量的數(shù)據(jù)中得到推理和結(jié)論瑞凑,然后再反向論證。隨著各種傳感器的普及概页,人類(lèi)社會(huì)中非結(jié)構(gòu)化數(shù)據(jù)不斷上升籽御,大數(shù)據(jù)加人工智能應(yīng)該會(huì)發(fā)生一些很有趣的結(jié)果。因?yàn)樾碌目茖W(xué)定理發(fā)現(xiàn)之后會(huì)應(yīng)用到全人類(lèi)生產(chǎn)和生活里惰匙。
這樣帶來(lái)一個(gè)很大的問(wèn)題技掏,就是過(guò)去20多年來(lái),基礎(chǔ)學(xué)科驗(yàn)證方法可能全部都要推翻项鬼。做實(shí)驗(yàn)的方式完全不一樣哑梳,未來(lái)可能每個(gè)人都需要學(xué)習(xí)計(jì)算機(jī)技術(shù)以及大數(shù)據(jù),然后再細(xì)分行業(yè)去做實(shí)驗(yàn)秃臣。
4.大數(shù)據(jù)關(guān)鍵技術(shù)
分布式存儲(chǔ)和分布式處理
5. 大數(shù)據(jù)計(jì)算模式
個(gè)人總結(jié):針對(duì)不同的應(yīng)用場(chǎng)景涧衙,需要用到不同的工具。而且每個(gè)工具的核心應(yīng)該不太一樣奥此,因?yàn)橐幚淼乃惴ǜ绞讲灰粯拥摹?/p>
6. 云計(jì)算
這些云的目的其實(shí)就是即開(kāi)即用啦弧哎,按需租借。
2018.06.05 學(xué)習(xí)筆記
林子雨老師的 《 大數(shù)據(jù)技術(shù)原理與應(yīng)用》
中國(guó)MOOC上有課稚虎,但是我交不了作業(yè)了QAQ撤嫩,太晚遇見(jiàn)這個(gè)課程了。