企業(yè)大數(shù)據(jù)平臺(tái)技術(shù)體系架構(gòu)

2015年國(guó)務(wù)院向社會(huì)公布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》明確提出了大數(shù)據(jù)的基本概念:大數(shù)據(jù)是以容量大脚作、類(lèi)型多葫哗、存取速度快、應(yīng)用價(jià)值高位為主要特征的數(shù)據(jù)集合球涛,正快速發(fā)展為對(duì)數(shù)量巨大劣针、來(lái)源分散、格式多樣的數(shù)據(jù)進(jìn)行采集亿扁、存儲(chǔ)和關(guān)聯(lián)分析捺典,從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值从祝、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)襟己。近幾年來(lái),隨著企業(yè)積累的數(shù)據(jù)越來(lái)越多牍陌。如何利用大數(shù)據(jù)技術(shù)構(gòu)建企業(yè)大數(shù)據(jù)平臺(tái)擎浴,以充分體現(xiàn)大數(shù)據(jù)的價(jià)值,是各行各業(yè)一直在不斷探索和追求的目標(biāo)毒涧。那么贮预,企業(yè)大數(shù)據(jù)平臺(tái)技術(shù)體系架構(gòu)究竟如何規(guī)劃呢?筆者結(jié)合多年企業(yè)大數(shù)據(jù)平臺(tái)建設(shè)經(jīng)驗(yàn),將企業(yè)大數(shù)據(jù)平臺(tái)概括為6個(gè)主要環(huán)節(jié)仿吞。從數(shù)據(jù)源開(kāi)始滑频,依次為數(shù)據(jù)采集、數(shù)據(jù)處理唤冈、數(shù)據(jù)存儲(chǔ)峡迷、數(shù)據(jù)服務(wù)、數(shù)據(jù)展示以及數(shù)據(jù)質(zhì)量管理你虹。企業(yè)大數(shù)據(jù)平臺(tái)技術(shù)體系架構(gòu)绘搞,如下圖所示:

技術(shù)體系架構(gòu)

數(shù)據(jù)采集層的主要目標(biāo)是從數(shù)據(jù)源收集數(shù)量巨大、來(lái)源分散售葡、格式多樣的數(shù)據(jù)到企業(yè)大數(shù)據(jù)平臺(tái)看杭。一般采取實(shí)時(shí)數(shù)據(jù)增量采集和歷史數(shù)據(jù)批量采集兩種解決方案。實(shí)時(shí)數(shù)據(jù)增量采集在監(jiān)控領(lǐng)域應(yīng)用比較廣泛挟伙,快速楼雹、高效收集數(shù)據(jù)源產(chǎn)生的實(shí)時(shí)數(shù)據(jù),以便即時(shí)響應(yīng)和處理尖阔;歷史數(shù)據(jù)批量采集則是將數(shù)據(jù)源歷史一段時(shí)間的數(shù)據(jù)全部抽取到企業(yè)大數(shù)據(jù)平臺(tái)贮缅,數(shù)據(jù)采集存在一定的延遲,適合數(shù)據(jù)補(bǔ)采介却、周期性計(jì)算等實(shí)時(shí)性要求不高的業(yè)務(wù)應(yīng)用場(chǎng)景谴供。

數(shù)據(jù)采集層

數(shù)據(jù)處理層是從大量的原始數(shù)據(jù)中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值齿坷、提升新能力的過(guò)程桂肌,是企業(yè)大數(shù)據(jù)平臺(tái)建設(shè)的關(guān)鍵環(huán)節(jié)。數(shù)據(jù)處理層既要滿足常規(guī)的統(tǒng)計(jì)分析和有價(jià)值的數(shù)據(jù)挖掘等離線歷史大數(shù)據(jù)處理要求永淌,還要兼顧時(shí)效性要求高的在線實(shí)時(shí)流數(shù)據(jù)處理要求崎场。在線實(shí)時(shí)流數(shù)據(jù)處理要求數(shù)據(jù)實(shí)時(shí)采集、實(shí)時(shí)處理遂蛀、實(shí)時(shí)反饋和實(shí)時(shí)輸出谭跨,響應(yīng)時(shí)間在秒級(jí)甚至于毫秒級(jí)。離線歷史大數(shù)據(jù)處理通常是針對(duì)批量采集數(shù)據(jù)李滴,數(shù)據(jù)處理量大螃宙,達(dá)到TB、PB級(jí)以上所坯,數(shù)據(jù)處理周期以分鐘谆扎、小時(shí)、天為單位芹助。當(dāng)然燕酷,對(duì)于實(shí)時(shí)增量數(shù)據(jù)籍凝,我們可以以增量方式處理分鐘、小時(shí)苗缩、天為單位的統(tǒng)計(jì)數(shù)據(jù),以提高系統(tǒng)處理效率声诸。

數(shù)據(jù)處理層

數(shù)據(jù)存儲(chǔ)層是大數(shù)據(jù)集合酱讶、主題數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)彼乌、基礎(chǔ)數(shù)據(jù)等持久化的存儲(chǔ)中心泻肯。一般包括關(guān)系型數(shù)據(jù)庫(kù)和分布式文件系統(tǒng)兩種。關(guān)系型數(shù)據(jù)庫(kù)用于存儲(chǔ)主題數(shù)據(jù)慰照、業(yè)務(wù)數(shù)據(jù)灶挟、基礎(chǔ)數(shù)據(jù)等;分布式文件系統(tǒng)用于存儲(chǔ)大數(shù)據(jù)集合毒租。

數(shù)據(jù)服務(wù)層是大數(shù)據(jù)對(duì)外共享發(fā)布通道稚铣。目前應(yīng)用最多的是以服務(wù)接口的形式對(duì)外提供,或者以消息訂閱推送的方式對(duì)外提供墅垮。

數(shù)據(jù)展示層是企業(yè)大數(shù)據(jù)平臺(tái)的圖形用戶接口惕医。展現(xiàn)形式可以多樣化,最典型的三種方式是:移動(dòng)客戶端算色、個(gè)人工作站和可視化大屏幕抬伺。

數(shù)據(jù)質(zhì)量管理是貫穿數(shù)據(jù)采集、數(shù)據(jù)處理灾梦、數(shù)據(jù)存儲(chǔ)峡钓、數(shù)據(jù)服務(wù)和數(shù)據(jù)展現(xiàn)的全過(guò)程質(zhì)量管理體系。

結(jié)束語(yǔ):企業(yè)大數(shù)據(jù)平臺(tái)技術(shù)架構(gòu)實(shí)現(xiàn)的關(guān)鍵是如何選擇開(kāi)源技術(shù)實(shí)現(xiàn)數(shù)據(jù)采集若河、數(shù)據(jù)處理能岩、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)服務(wù)和數(shù)據(jù)展現(xiàn)5個(gè)層次的應(yīng)用牡肉,以及建設(shè)一套標(biāo)準(zhǔn)化的全過(guò)程的數(shù)據(jù)質(zhì)量管理體系捧灰。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市统锤,隨后出現(xiàn)的幾起案子毛俏,更是在濱河造成了極大的恐慌,老刑警劉巖饲窿,帶你破解...
    沈念sama閱讀 218,284評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件煌寇,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡逾雄,警方通過(guò)查閱死者的電腦和手機(jī)阀溶,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)腻脏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人银锻,你說(shuō)我怎么就攤上這事永品。” “怎么了击纬?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,614評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵鼎姐,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我更振,道長(zhǎng)炕桨,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,671評(píng)論 1 293
  • 正文 為了忘掉前任肯腕,我火速辦了婚禮献宫,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘实撒。我一直安慰自己姊途,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,699評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布奈惑。 她就那樣靜靜地躺著吭净,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肴甸。 梳的紋絲不亂的頭發(fā)上寂殉,一...
    開(kāi)封第一講書(shū)人閱讀 51,562評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音原在,去河邊找鬼友扰。 笑死,一個(gè)胖子當(dāng)著我的面吹牛庶柿,可吹牛的內(nèi)容都是我干的村怪。 我是一名探鬼主播,決...
    沈念sama閱讀 40,309評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼浮庐,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼甚负!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起审残,我...
    開(kāi)封第一講書(shū)人閱讀 39,223評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤梭域,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后搅轿,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體病涨,經(jīng)...
    沈念sama閱讀 45,668評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,859評(píng)論 3 336
  • 正文 我和宋清朗相戀三年璧坟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了既穆。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赎懦。...
    茶點(diǎn)故事閱讀 39,981評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖幻工,靈堂內(nèi)的尸體忽然破棺而出励两,到底是詐尸還是另有隱情,我是刑警寧澤会钝,帶...
    沈念sama閱讀 35,705評(píng)論 5 347
  • 正文 年R本政府宣布伐蒋,位于F島的核電站,受9級(jí)特大地震影響迁酸,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜俭正,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,310評(píng)論 3 330
  • 文/蒙蒙 一奸鬓、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧掸读,春花似錦串远、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,904評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至肾请,卻和暖如春留搔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背铛铁。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,023評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工隔显, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人饵逐。 一個(gè)月前我還...
    沈念sama閱讀 48,146評(píng)論 3 370
  • 正文 我出身青樓括眠,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親倍权。 傳聞我的和親對(duì)象是個(gè)殘疾皇子掷豺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,933評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 大數(shù)據(jù)學(xué)習(xí)交流群:808769635 前段時(shí)間有報(bào)道稱,有學(xué)者質(zhì)疑“大數(shù)據(jù)”理論薄声,也有硅谷公司負(fù)責(zé)人質(zhì)疑大數(shù)據(jù)應(yīng)用...
    順治帝閱讀 3,248評(píng)論 0 5
  • 姓名:崔升 學(xué)號(hào):14020120005 文章來(lái)源:36大數(shù)據(jù) 【嵌牛導(dǎo)讀】: 當(dāng)下流行的大數(shù)據(jù)是一個(gè)被炒的極其...
    冬瓜小正太閱讀 2,612評(píng)論 0 1
  • 國(guó)慶的計(jì)劃 有沒(méi)有這樣孩子奸柬。 國(guó)慶不出門(mén)生年,不坐車(chē)。 舉國(guó)歡慶的日子里廓奕,人們迎來(lái)了一段“小長(zhǎng)假”抱婉,貓咪西西也和人類(lèi)一...
    蟹先生的咖啡屋閱讀 280評(píng)論 0 1
  • 昨天看到一句話档叔,覺(jué)得很好,記下來(lái)了蒸绩。 你要不顧一切讓自己變得漂亮衙四,即使是在那些糟糕的日子里』家冢——勺布斯 想起曾經(jīng)有...
    醉染馨香閱讀 402評(píng)論 0 3
  • 最近被芳華刷屏传蹈,就暫停下荊棘鳥(niǎo)把這本書(shū)下來(lái)看,講訴的是1970年代的故事步藕,文工團(tuán)一群年輕人的故事惦界,劉峰,瀟子惠咙冗,何...
    hanxuerping閱讀 149評(píng)論 0 0