8 V Characteristics:
- Volume 量
- Velocity 速度
- Variety 多樣性
- Veracity 誠實準確性
- Value 價值
- Variability 可變性
- Viscosity 粘度
- Virality 擴散性
【Hadoop】大數(shù)據(jù)時代舰攒,我們?yōu)槭裁词褂胔adoop - 大牛筆記 - CSDN博客 http://blog.csdn.net/weixuehao/article/details/14126199
大量:這個大家都知道鸠信,想百度歹河,淘寶,騰訊舆绎,F(xiàn)acebook鲤脏,Twitter等網(wǎng)站上的一些信息,這肯定算是大數(shù)據(jù)了亿蒸,都要存儲下來凑兰。
多樣:數(shù)據(jù)的多樣性掌桩,是說數(shù)據(jù)可能是結構型的數(shù)據(jù)边锁,也可能是非結構行的文本,圖片波岛,視頻茅坛,語音,日志则拷,郵件等贡蓖。
實時:大數(shù)據(jù)需要快速的,實時的進行處理煌茬。如果說對時間要求低斥铺,那弄幾個機器,對小數(shù)據(jù)進行處理坛善,等個十天半月的出來結果晾蜘,這樣也沒有什么意義了。
不確定: 數(shù)據(jù)是存在真?zhèn)蔚拿呤海鞣N各樣的數(shù)據(jù)剔交,有的有用,有的沒用改衩。很難辨析岖常。
根據(jù)以上的特點,我們需要一個東西葫督,來:
1存儲大量數(shù)據(jù)
2快速的處理大量數(shù)據(jù)
3從大量數(shù)據(jù)中進行分析
于是就有了這樣一個模型Hadoop竭鞍。