特點(diǎn)
“大量化(Volume)、多樣化(Variety)臼予、快速化(Velocity)、價(jià)值密度低(Value)”就是“大數(shù)據(jù)”的顯著特征啃沪,或者說粘拾,只有具備這些特點(diǎn)的數(shù)據(jù),才是大數(shù)據(jù)创千。
用途
相關(guān)技術(shù)
數(shù)據(jù)采集:ETL缰雇,數(shù)據(jù)眾包
數(shù)據(jù)存儲(chǔ)與管理:結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)追驴,
? ? ? ? ? ? ? ? ? ? ? ? ? ? 分布式文件系統(tǒng)(Google文件系統(tǒng)械哟,Hadoop),
? ? ? ? ? ? ? ? ? ? ? ? ? ? 關(guān)系數(shù)據(jù)庫(kù)殿雪,非關(guān)系數(shù)據(jù)庫(kù)(NoSQL暇咆,mongoDB,Redis)丙曙,數(shù)據(jù)倉(cāng)庫(kù)爸业,云 計(jì)算和云存儲(chǔ),實(shí)時(shí)流處理(twitter的Storm亏镰,yahoo的S4)
數(shù)據(jù)分析與挖掘:A/B Testing扯旷,關(guān)聯(lián)規(guī)則分析,分類拆挥,聚類薄霜,遺傳算法,神經(jīng)網(wǎng)絡(luò)纸兔,預(yù)測(cè)模型惰瓜,模式識(shí)別,時(shí)間序列分析汉矿,回歸分析崎坊,系統(tǒng)仿真,機(jī)器學(xué)習(xí)洲拇,優(yōu)化奈揍,空間分析,社會(huì)網(wǎng)絡(luò)分析赋续,自然語(yǔ)言分析男翰,MapReduce,R語(yǔ)言等
計(jì)算結(jié)果展示:標(biāo)簽云(Tag Cloud)纽乱,聚類圖(Clustergram)蛾绎,空間信息流(Spatial information flow),熱圖(Heatmap)