對(duì)于一些新手朋友來(lái)說(shuō)阻肿,剛接觸大數(shù)據(jù)不知從何學(xué)起瓦戚,首先先了解下什么是大數(shù)據(jù)?大數(shù)據(jù)(big data,mega data)丛塌,或稱巨量資料较解,指的是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量姨伤、高增長(zhǎng)率和多樣化的信息資產(chǎn)哨坪。 在維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫(xiě)的《大數(shù)據(jù)時(shí)代》中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理乍楚。大數(shù)據(jù)的5V特點(diǎn):Volume(大量)当编、Velocity(高速)、Variety(多樣)徒溪、Value(價(jià)值密度)忿偷、Veracity(真實(shí)性)金顿。
這里還是要推薦下小編的大數(shù)據(jù)學(xué)習(xí)群:532218147,不管你是小白還是大牛鲤桥,小編我都?xì)g迎揍拆,不定期分享干貨,包括小編自己整理的一份2017最新的大數(shù)據(jù)資料和0基礎(chǔ)入門(mén)教程茶凳,歡迎初學(xué)和進(jìn)階中的小伙伴嫂拴。在不忙的時(shí)間我會(huì)給解答
簡(jiǎn)言之,從各種各樣類(lèi)型的數(shù)據(jù)中贮喧,快速獲得有價(jià)值信息的能力筒狠,就是大數(shù)據(jù)技術(shù)。明白這一點(diǎn)至關(guān)重要箱沦,也正是這一點(diǎn)促使該技術(shù)具備走向眾多企業(yè)的潛力辩恼。
大數(shù)據(jù)的5個(gè)“V”,或者說(shuō)特點(diǎn)有五層面:
第一谓形,數(shù)據(jù)體量巨大
從TB級(jí)別灶伊,躍升到PB級(jí)別。
第二寒跳,數(shù)據(jù)類(lèi)型繁多
前文提到的網(wǎng)絡(luò)日志聘萨、視頻、圖片冯袍、地理位置信息等等匈挖。
第三碾牌,價(jià)值密度低
以視頻為例康愤,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒舶吗。
第四征冷,處理速度快
1秒定律。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同誓琼。業(yè)界將其歸納為4個(gè)“V”——Volume检激,Variety,Value腹侣,Velocity叔收。
物聯(lián)網(wǎng)、云計(jì)算傲隶、移動(dòng)互聯(lián)網(wǎng)饺律、車(chē)聯(lián)網(wǎng)、手機(jī)跺株、平板電腦复濒、PC以及遍布地球各個(gè)角落的各種各樣的傳感器脖卖,無(wú)一不是數(shù)據(jù)來(lái)源或者承載的方式。
下面附上一張大數(shù)據(jù)學(xué)習(xí)路線圖巧颈,僅供大家參考畦木!