總述

數(shù)據(jù)的井噴式爆發(fā),如何做好數(shù)據(jù)模型深胳、數(shù)據(jù)研發(fā)绰疤、數(shù)據(jù)質(zhì)量和運(yùn)維保障工作,并且如何提高用戶(hù)的數(shù)據(jù)使用滿(mǎn)意度舞终,即數(shù)據(jù)服務(wù)和數(shù)據(jù)產(chǎn)品也是需要我們思考的問(wèn)題轻庆。

如何建設(shè)高效的數(shù)據(jù)模型和體系,使數(shù)據(jù)易用敛劝,避免重復(fù)建設(shè)和數(shù)據(jù)不一致性余爆,保證數(shù)據(jù)的規(guī)范性;如何提供高效易用的數(shù)據(jù)開(kāi)發(fā)工具夸盟;如何做好數(shù)據(jù)質(zhì)量保障蛾方;如何有效管理和控制日益增長(zhǎng)的存儲(chǔ)和計(jì)算消耗;如何保證數(shù)據(jù)服務(wù)的穩(wěn)定上陕,保證其性能桩砰;如何設(shè)計(jì)有效的數(shù)據(jù)產(chǎn)品高效賦能于外部客戶(hù)和內(nèi)部員工......

1、數(shù)據(jù)采集層--一套標(biāo)準(zhǔn)的數(shù)據(jù)采集體系方案

阿里巴巴的日志采集體系方案包括兩大體系:Aplus.JS是web端日志采集技術(shù)方案释簿;UserTrack是APP端日志采集技術(shù)方案亚隅。用以滿(mǎn)足瀏覽、點(diǎn)擊辕万、特殊交互枢步、APP事件、H5及APP里的H5和Native日志數(shù)據(jù)打通等多種業(yè)務(wù)場(chǎng)景渐尿。

同事還建立了一套高性能醉途、高可靠性的數(shù)據(jù)傳輸體系,完成數(shù)據(jù)從生產(chǎn)業(yè)務(wù)端到大數(shù)據(jù)系統(tǒng)的傳輸砖茸。采用TimeTunnel(TT)隘擎,既能包括數(shù)據(jù)庫(kù)的增量數(shù)據(jù)傳輸,也包括日志數(shù)據(jù)傳輸凉夯;TT作為數(shù)據(jù)傳輸服務(wù)的基礎(chǔ)架構(gòu)货葬,既支持實(shí)時(shí)流式計(jì)算,也支持各種事件窗口的批量計(jì)算劲够。另外震桶,也通過(guò)數(shù)據(jù)同步工具(DataX和同步中心,其中同步中心是基于DataX易用性封裝的)直連異構(gòu)數(shù)據(jù)庫(kù)(備庫(kù))來(lái)抽取各種時(shí)間窗口的數(shù)據(jù)征绎。

2蹲姐、數(shù)據(jù)計(jì)算層--數(shù)據(jù)的整合與計(jì)算

阿里巴巴的數(shù)據(jù)計(jì)算層包括兩大體系:數(shù)據(jù)存儲(chǔ)及計(jì)算云平臺(tái)(離線計(jì)算平臺(tái)MaxCompute和實(shí)時(shí)計(jì)算平臺(tái)StreamCompute)和數(shù)據(jù)整合及管理體系(內(nèi)部稱(chēng)之為“OneData”)。其中MaxCompute是離線大數(shù)據(jù)平臺(tái),其豐富的功能和強(qiáng)大的存儲(chǔ)及計(jì)算能力使得阿里巴巴的大數(shù)據(jù)有了強(qiáng)大的存儲(chǔ)和計(jì)算引擎柴墩;StreamCompute是流式大數(shù)據(jù)平臺(tái)忙厌;OneData是數(shù)據(jù)整合及管理的方法體系和工具,構(gòu)建統(tǒng)一江咳、規(guī)范逢净、可共享的全域數(shù)據(jù)體系,避免數(shù)據(jù)的冗余和重復(fù)建設(shè)歼指,規(guī)避數(shù)據(jù)煙囪和不一致性爹土,充分發(fā)揮海量、多樣性等方面的優(yōu)勢(shì)东臀。借助統(tǒng)一化數(shù)據(jù)整合及管理的方法體系着饥,構(gòu)建了數(shù)據(jù)公共層。

間里數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)加工鏈路也是遵循業(yè)界的分層理念惰赋,包括操作數(shù)據(jù)層( Operational Data Store, ODS )、明細(xì)數(shù)據(jù)層( Data WarehouseDetail , DWD )呵哨、匯總數(shù)據(jù)層( Data Warehouse Summary, DWS )和應(yīng)用數(shù)據(jù)層( Application Data Store, ADS )赁濒。。通過(guò)數(shù)據(jù)倉(cāng)庫(kù)不同層次之間的加工過(guò)程實(shí)現(xiàn)從數(shù)據(jù)資產(chǎn)向信息資產(chǎn)的轉(zhuǎn)化孟害,并且對(duì)整個(gè)過(guò)程進(jìn)行有效的元數(shù)據(jù)管理及數(shù)據(jù)質(zhì)量處理拒炎。

在阿里大數(shù)據(jù)系統(tǒng)中,元數(shù)據(jù)模型整合及應(yīng)用是一個(gè)重要的組成部分挨务,主要包含數(shù)據(jù)源元數(shù)據(jù)击你、數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù) 、數(shù)據(jù)鏈路元數(shù)據(jù)谎柄、工具類(lèi)元數(shù)據(jù) 數(shù)據(jù)質(zhì)量類(lèi)元數(shù)據(jù)等丁侄。元數(shù)據(jù)應(yīng)用主要面向數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)管理等 朝巫,如用于存儲(chǔ)鸿摇、計(jì)算和成本管理等。

3劈猿、數(shù)據(jù)服務(wù)層--提供產(chǎn)品和應(yīng)用進(jìn)行數(shù)據(jù)消費(fèi)

數(shù)據(jù)服務(wù)可以使應(yīng)用對(duì)底層數(shù)據(jù)存儲(chǔ)透明拙吉,將海量數(shù)據(jù)方便高效地開(kāi)放給集團(tuán)內(nèi)部各應(yīng)用使用。數(shù)據(jù)服務(wù)層對(duì)外提供數(shù)據(jù)服務(wù)主要是通過(guò)統(tǒng)一的數(shù)據(jù)服務(wù)平臺(tái)(方便閱讀揪荣,簡(jiǎn)稱(chēng)為“OneService ”)筷黔。One Service 以數(shù)據(jù)倉(cāng)庫(kù)整合計(jì)算好的數(shù)據(jù)作為數(shù)據(jù)源,對(duì)外通過(guò)接口的方式提供數(shù)據(jù)服務(wù)仗颈,主要提供簡(jiǎn)單數(shù)據(jù)查詢(xún)服務(wù)佛舱、復(fù)雜數(shù)據(jù)查詢(xún)服務(wù)(承接集團(tuán)用戶(hù)識(shí)別、用戶(hù)畫(huà)像等復(fù)雜數(shù)據(jù)查詢(xún)服務(wù))和實(shí)時(shí)數(shù)據(jù)推送服務(wù)三大特色數(shù)據(jù)服務(wù)。

4名眉、數(shù)據(jù)應(yīng)用層--通過(guò)合適的應(yīng)用提供給用戶(hù)粟矿,讓數(shù)據(jù)最大化地發(fā)揮價(jià)值。

如搜索损拢、推薦陌粹、廣告、金融福压、信用掏秩、保險(xiǎn)、文娛荆姆、物流等蒙幻。阿里內(nèi)部的運(yùn)營(yíng)和管理人員等,都是數(shù)據(jù)應(yīng)用方胆筒; ISV研究機(jī)構(gòu)和社會(huì)組織等也可以利用阿里開(kāi)放的數(shù)據(jù)能力和技術(shù)邮破。

我們相信,數(shù)據(jù)作為新能源仆救,為產(chǎn)業(yè)注人的變革是顯而易見(jiàn)的抒和。我們對(duì)數(shù)據(jù)新能源的探索也不僅僅停留在狹義的技術(shù)、服務(wù)和應(yīng)用上彤蔽。我們正在挖掘大數(shù)據(jù)更深層次的價(jià)值摧莽,為社會(huì)經(jīng)濟(jì)和民生基礎(chǔ)建設(shè)等提供創(chuàng)新方法。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末顿痪,一起剝皮案震驚了整個(gè)濱河市镊辕,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蚁袭,老刑警劉巖征懈,帶你破解...
    沈念sama閱讀 216,692評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異撕阎,居然都是意外死亡受裹,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)虏束,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)棉饶,“玉大人,你說(shuō)我怎么就攤上這事镇匀≌赵澹” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,995評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵汗侵,是天一觀的道長(zhǎng)幸缕。 經(jīng)常有香客問(wèn)我群发,道長(zhǎng),這世上最難降的妖魔是什么发乔? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,223評(píng)論 1 292
  • 正文 為了忘掉前任熟妓,我火速辦了婚禮,結(jié)果婚禮上栏尚,老公的妹妹穿的比我還像新娘起愈。我一直安慰自己,他們只是感情好译仗,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,245評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布抬虽。 她就那樣靜靜地躺著,像睡著了一般纵菌。 火紅的嫁衣襯著肌膚如雪阐污。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,208評(píng)論 1 299
  • 那天咱圆,我揣著相機(jī)與錄音笛辟,去河邊找鬼。 笑死序苏,一個(gè)胖子當(dāng)著我的面吹牛隘膘,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播杠览,決...
    沈念sama閱讀 40,091評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼纵势!你這毒婦竟也來(lái)了踱阿?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,929評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤钦铁,失蹤者是張志新(化名)和其女友劉穎软舌,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體牛曹,經(jīng)...
    沈念sama閱讀 45,346評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡佛点,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,570評(píng)論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了黎比。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片超营。...
    茶點(diǎn)故事閱讀 39,739評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖阅虫,靈堂內(nèi)的尸體忽然破棺而出演闭,到底是詐尸還是另有隱情,我是刑警寧澤颓帝,帶...
    沈念sama閱讀 35,437評(píng)論 5 344
  • 正文 年R本政府宣布米碰,位于F島的核電站窝革,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏吕座。R本人自食惡果不足惜虐译,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,037評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吴趴。 院中可真熱鬧漆诽,春花似錦、人聲如沸史侣。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,677評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)惊橱。三九已至蚪腐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間税朴,已是汗流浹背回季。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,833評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留正林,地道東北人泡一。 一個(gè)月前我還...
    沈念sama閱讀 47,760評(píng)論 2 369
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像觅廓,于是被迫代替她去往敵國(guó)和親鼻忠。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,647評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容