大數(shù)據(jù)基礎(chǔ)概念

WeChat Image_20181020171108.png

傳統(tǒng)的大數(shù)據(jù)

在大數(shù)據(jù)這個(gè)概念還沒(méi)出來(lái)以前人們是怎么進(jìn)行數(shù)據(jù)數(shù)據(jù)分析和計(jì)算的呢睦番?

數(shù)據(jù)存儲(chǔ)

首先數(shù)據(jù)量都沒(méi)有很大,不同的數(shù)據(jù)散布在不同數(shù)據(jù)庫(kù)中掰伸。如果真的數(shù)據(jù)大的話就只能花最貴的錢(qián)買(mǎi)最好的機(jī)器最好的數(shù)據(jù)庫(kù)或者多分幾個(gè)庫(kù)裝站辉。

數(shù)據(jù)分析

人們還沒(méi)有意識(shí)到數(shù)據(jù)可以做很多事情划栓,所以數(shù)據(jù)的需求也比較少; 使用傳統(tǒng)的數(shù)據(jù)庫(kù)和單機(jī)程序來(lái)進(jìn)行統(tǒng)計(jì)分析兑巾,就能滿足大部分需求。如果公司比較注重?cái)?shù)據(jù)的話忠荞,可能會(huì)弄一個(gè)數(shù)據(jù)中心蒋歌,匯總各種數(shù)據(jù),開(kāi)發(fā)一套數(shù)據(jù)分析系統(tǒng)來(lái)完成自動(dòng)化的報(bào)表钻洒。

轉(zhuǎn)折

數(shù)據(jù)量越來(lái)越大奋姿,數(shù)據(jù)分析的成本越來(lái)越高。某一天Google扔了三篇論文出來(lái)引爆了大數(shù)據(jù)(Google總喜歡把自己不用了的技術(shù)分享出來(lái))素标。這三篇論文提出了一個(gè)解決數(shù)據(jù)太多,存不下萍悴,計(jì)算不了方案头遭,從此打開(kāi)了大數(shù)據(jù)時(shí)代的門(mén)。人們根據(jù)這三篇論文?開(kāi)發(fā)了hadoop家族癣诱,后來(lái)成為大數(shù)據(jù)的標(biāo)配计维,開(kāi)始了全民大數(shù)據(jù)的時(shí)代。

現(xiàn)在的大數(shù)據(jù)

普遍的都利用hadoop家族建立起大數(shù)據(jù)平臺(tái)撕予,匯聚各種數(shù)據(jù)鲫惶,統(tǒng)一進(jìn)分析計(jì)算。

數(shù)據(jù)源&數(shù)據(jù)采集

自從大數(shù)據(jù)的處理工具完善之后实抡,基本能稱(chēng)得上數(shù)據(jù)的東西都可以整合進(jìn)大數(shù)據(jù)平臺(tái)欠母。比如,前端的用戶(hù)行為日志吆寨、后端數(shù)據(jù)庫(kù)赏淌、爬蟲(chóng)的數(shù)據(jù)等。

埋點(diǎn)

所謂的埋點(diǎn)就好比埋的地雷啄清,你走過(guò)地雷響了六水,我就知道你走過(guò)哪里。正常來(lái)說(shuō)就是你在網(wǎng)頁(yè)或app上點(diǎn)擊某個(gè)按鈕是就把你這個(gè)點(diǎn)擊行為記錄下來(lái)發(fā)給服務(wù)器,這樣就知道你都干了啥掷贾。?當(dāng)然埋點(diǎn)你可以自己寫(xiě)程序手動(dòng)埋睛榄,也可以引入第三方工具實(shí)現(xiàn)自動(dòng)話埋點(diǎn)。有時(shí)候前端不方便埋點(diǎn)就可以在服務(wù)器后端程序進(jìn)行埋點(diǎn)想帅。

數(shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)呢场靴,主要記錄一些狀態(tài)數(shù)據(jù),比如你的性別年齡啥的博脑。

數(shù)據(jù)接入

這么多數(shù)據(jù)源想要進(jìn)入大數(shù)據(jù)平臺(tái)憎乙,當(dāng)然都會(huì)有不同的渠道,同一個(gè)數(shù)據(jù)源也可能有不同的進(jìn)入方式叉趣。

批量數(shù)據(jù)

比如數(shù)據(jù)庫(kù)的數(shù)據(jù)都是些狀態(tài)數(shù)據(jù)泞边,業(yè)務(wù)的需求要求的實(shí)時(shí)性不高,可以每天批量的導(dǎo)入疗杉。導(dǎo)入的方式又可以分為增量和全量

全量

每次導(dǎo)入全部的數(shù)據(jù)阵谚,因?yàn)閿?shù)據(jù)是在不斷變化的,我們只截取導(dǎo)入時(shí)刻的數(shù)據(jù)烟具。

增量

每次導(dǎo)入有變化的數(shù)據(jù)梢什;當(dāng)數(shù)據(jù)有變化時(shí)我們就標(biāo)記一下每條數(shù)據(jù)變化的時(shí)間,依據(jù)這個(gè)時(shí)間判定這次是否導(dǎo)入朝聋。

實(shí)時(shí)流數(shù)據(jù)

像用戶(hù)行為這種數(shù)據(jù)每時(shí)每刻都在不斷的產(chǎn)生嗡午,業(yè)務(wù)的需求可以需要我們快速的反應(yīng),比如用戶(hù)搜索了某個(gè)商品下一秒馬上推送相關(guān)的商品冀痕。這時(shí)數(shù)據(jù)要快速的流動(dòng)快速的計(jì)算荔睹,就出現(xiàn)了數(shù)據(jù)總線的概念,把數(shù)據(jù)接入數(shù)據(jù)總線實(shí)時(shí)的流入大數(shù)據(jù)平臺(tái)言蛇。

數(shù)據(jù)存儲(chǔ)

大數(shù)據(jù)平臺(tái)的存儲(chǔ)其實(shí)是比較單一的僻他,就是一個(gè)分布式文件系統(tǒng),當(dāng)然這個(gè)文件系統(tǒng)又可以分各種存儲(chǔ)格式來(lái)存腊尚。

數(shù)據(jù)處理

數(shù)據(jù)處理就是大數(shù)據(jù)平臺(tái)的核心了吨拗。分實(shí)時(shí)的處理和批量處理。

數(shù)據(jù)查詢(xún)

數(shù)據(jù)在大數(shù)據(jù)平臺(tái)處理完成輸出到業(yè)務(wù)系統(tǒng)進(jìn)行使用婿斥,大數(shù)據(jù)平臺(tái)也可以直接提供查詢(xún)服務(wù)劝篷。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市受扳,隨后出現(xiàn)的幾起案子携龟,更是在濱河造成了極大的恐慌,老刑警劉巖勘高,帶你破解...
    沈念sama閱讀 219,110評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件峡蟋,死亡現(xiàn)場(chǎng)離奇詭異坟桅,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)蕊蝗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)仅乓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人蓬戚,你說(shuō)我怎么就攤上這事夸楣。” “怎么了子漩?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,474評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵豫喧,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我幢泼,道長(zhǎng)紧显,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,881評(píng)論 1 295
  • 正文 為了忘掉前任缕棵,我火速辦了婚禮孵班,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘招驴。我一直安慰自己篙程,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布别厘。 她就那樣靜靜地躺著虱饿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪触趴。 梳的紋絲不亂的頭發(fā)上郭厌,一...
    開(kāi)封第一講書(shū)人閱讀 51,698評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音雕蔽,去河邊找鬼。 笑死宾娜,一個(gè)胖子當(dāng)著我的面吹牛批狐,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播前塔,決...
    沈念sama閱讀 40,418評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼嚣艇,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了华弓?” 一聲冷哼從身側(cè)響起食零,我...
    開(kāi)封第一講書(shū)人閱讀 39,332評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寂屏,沒(méi)想到半個(gè)月后贰谣,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體娜搂,經(jīng)...
    沈念sama閱讀 45,796評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評(píng)論 3 337
  • 正文 我和宋清朗相戀三年吱抚,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了百宇。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,110評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡秘豹,死狀恐怖携御,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情既绕,我是刑警寧澤啄刹,帶...
    沈念sama閱讀 35,792評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站凄贩,受9級(jí)特大地震影響誓军,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜怎炊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評(píng)論 3 331
  • 文/蒙蒙 一谭企、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧评肆,春花似錦债查、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,003評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至久橙,卻和暖如春俄占,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背淆衷。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,130評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工缸榄, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人祝拯。 一個(gè)月前我還...
    沈念sama閱讀 48,348評(píng)論 3 373
  • 正文 我出身青樓甚带,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親佳头。 傳聞我的和親對(duì)象是個(gè)殘疾皇子鹰贵,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 忽逢桃花林,夾岸數(shù)百步康嘉,中無(wú)雜樹(shù)碉输,芳草鮮美,落英繽紛亭珍。 被桃花靈牽引著敷钾,走向林里深處枝哄。灼灼桃花,林十里闰非,莫能衡度之...
    眾聲閱讀 328評(píng)論 0 0
  • 愛(ài)情的成本很低膘格,低到說(shuō)愛(ài)你就能奉獻(xiàn)身體和靈魂。但是婚姻就不一樣财松,除了奉獻(xiàn)愛(ài)瘪贱,還有消耗精神和金錢(qián)×菊保婚姻菜秦,更是一...
    你的方式閱讀 252評(píng)論 3 4
  • 其實(shí)我一直都記得你 不曾忘記 偶爾的撒嬌 壞脾氣 就像熟透的紅蘋(píng)果 懸掛枝頭 我知道在你的心中我已不是最初的那個(gè)唯...
    茻暮南森閱讀 176評(píng)論 0 0
  • 這個(gè)世界很殘酷眨攘,它逼著你按照劇本去走主慰,逼著你不準(zhǔn)和大多數(shù)人不一樣,每個(gè)人身后都有千萬(wàn)條無(wú)形的線拉扯著你默默前行鲫售,什...
    佐耳洛閱讀 175評(píng)論 0 0
  • 生了孩子后共螺,我變得猶其強(qiáng)大,可以整晚整晚不睡覺(jué)情竹,就為了照顧老是哭鬧不止的他藐不,眼皮直往下掉還撐著身體抱著他在房里有一...
    千千度閱讀 1,405評(píng)論 0 0