對于一些新手朋友來說戚哎,剛接觸大數(shù)據(jù)不知從何學(xué)起,首先先了解下什么是大數(shù)據(jù)嫂用?大數(shù)據(jù)(big data,mega data)型凳,或稱巨量資料,指的是需要新處理模式才能具有更強(qiáng)的決策力嘱函、洞察力和流程優(yōu)化能力的海量甘畅、高增長率和多樣化的信息資產(chǎn)。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理疏唾。大數(shù)據(jù)的5V特點:Volume(大量)蓄氧、Velocity(高速)、Variety(多樣)槐脏、Value(價值密度)喉童、Veracity(真實性)。
簡言之顿天,從各種各樣類型的數(shù)據(jù)中堂氯,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術(shù)牌废。明白這一點至關(guān)重要咽白,也正是這一點促使該技術(shù)具備走向眾多企業(yè)的潛力。
大數(shù)據(jù)的5個“V”鸟缕,或者說特點有五層面:
大數(shù)據(jù)學(xué)習(xí)群:716581014
第一晶框,數(shù)據(jù)體量巨大
從TB級別,躍升到PB級別懂从。
第二授段,數(shù)據(jù)類型繁多
前文提到的網(wǎng)絡(luò)日志、視頻莫绣、圖片畴蒲、地理位置信息等等。
第三对室,價值密度低
以視頻為例模燥,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒掩宜。
第四蔫骂,處理速度快
1秒定律。最后這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同牺汤。業(yè)界將其歸納為4個“V”——Volume辽旋,Variety,Value檐迟,Velocity补胚。
物聯(lián)網(wǎng)、云計算追迟、移動互聯(lián)網(wǎng)溶其、車聯(lián)網(wǎng)、手機(jī)敦间、平板電腦瓶逃、PC以及遍布地球各個角落的各種各樣的傳感器束铭,無一不是數(shù)據(jù)來源或者承載的方式。
下面附上一張大數(shù)據(jù)學(xué)習(xí)路線圖厢绝,僅供大家參考契沫!