有人說(shuō)大數(shù)據(jù)技術(shù)是第四次技術(shù)革命,這個(gè)說(shuō)法其實(shí)不為過(guò)惠毁。很多人只是聽(tīng)過(guò)大數(shù)據(jù)這個(gè)詞或者是簡(jiǎn)單知道它是什么犹芹,那么它是什么呢,在這里就通俗點(diǎn)來(lái)說(shuō)一下個(gè)人對(duì)大數(shù)據(jù)的理解鞠绰。
大數(shù)據(jù)腰埂,很明顯從字面上理解就是大量的數(shù)據(jù),海量的數(shù)據(jù)蜈膨。大屿笼,意思就是數(shù)據(jù)的量級(jí)很大,不上TB都不好意思說(shuō)是大數(shù)據(jù)翁巍。數(shù)據(jù)刁卜,狹義上理解就是12345那么些數(shù)據(jù),畢竟計(jì)算機(jī)底層是二進(jìn)制來(lái)存的曙咽,那么在大數(shù)據(jù)領(lǐng)域蛔趴,數(shù)據(jù)就不僅僅包括數(shù)字這些,它可以是所有格式的東西例朱,比如日志孝情,音頻視頻,文件等等洒嗤。
所以箫荡,大數(shù)據(jù)從字面上理解就是海量的數(shù)據(jù),技術(shù)上它包括這些海量數(shù)據(jù)的采集渔隶,過(guò)濾羔挡,清洗,存儲(chǔ)间唉,處理绞灼,查看等等部分,每一個(gè)部分包括一些大數(shù)據(jù)的相關(guān)技術(shù)框架來(lái)支持呈野。
舉個(gè)例子低矮,淘寶雙十一的總交易額的顯示,后面就是大數(shù)據(jù)技術(shù)的支持被冒,全國(guó)那么多淘寶用戶的交易記錄匯聚到一起军掂,數(shù)據(jù)量很大轮蜕,而且要做到實(shí)時(shí)的展現(xiàn),就需要強(qiáng)有力的大數(shù)據(jù)技術(shù)來(lái)處理了蝗锥。
數(shù)據(jù)量一大跃洛,那么得找地方來(lái)存,一個(gè)服務(wù)器硬盤(pán)可以掛多少终议,肯定滿足不了這么大的數(shù)據(jù)量存儲(chǔ)啊税课,所以,分布式的存儲(chǔ)系統(tǒng)應(yīng)運(yùn)而生痊剖,那就是HDFS分布式文件系統(tǒng)韩玩。簡(jiǎn)單的說(shuō),就是把這么大的數(shù)據(jù)分開(kāi)存在甚至幾百甚至幾千臺(tái)服務(wù)器上陆馁,那么管理他們的系統(tǒng)就是HDFS文件系統(tǒng)找颓,也是大數(shù)據(jù)技術(shù)的最基本的組件。
有地方存了叮贩,需要一些分布式的數(shù)據(jù)庫(kù)來(lái)管理查詢啊击狮,那就有了hbase等,還需要一些組件來(lái)計(jì)算分析這些數(shù)據(jù)啊益老,mapreduce是最基本的計(jì)算框架彪蓬,其他的計(jì)算框架Spark和Storm可以完成實(shí)時(shí)的處理,其中HDFS和MapReduce組成了Hadoop1.
一言以蔽之捺萌,圍繞大數(shù)據(jù)的發(fā)展档冬,新興了大數(shù)據(jù)技術(shù),大數(shù)據(jù)的互聯(lián)網(wǎng)公司桃纯,以及大數(shù)據(jù)技術(shù)的相關(guān)培訓(xùn)公司酷誓,超人學(xué)院就是其中一個(gè)全方位的大數(shù)據(jù)培訓(xùn)公司,因?yàn)槲冶旧硪郧笆亲雠嘤?xùn)的态坦,我是不是在打廣告盐数。。伞梯。
總之玫氢,一切都是數(shù)據(jù)。我們的歷史谜诫,是不是都是大量的數(shù)據(jù)保存下來(lái)的漾峡,現(xiàn)在我們也是大數(shù)據(jù)的生活,天天有沒(méi)有接到騷擾電話還知道你姓什么猜绣,你查話費(fèi)什么的從幾億人的數(shù)據(jù)中查到你的信息灰殴,大數(shù)據(jù)生活。未來(lái)掰邢,大數(shù)據(jù)將更深刻的滲透到生活中牺陶。
想了解更多大數(shù)據(jù)知識(shí)可以到科多大數(shù)據(jù)了解:
http://www.keduox.cn/?service=Personage.index