最近在讀阿里數(shù)據(jù)中臺(tái)的書模燥,因?yàn)橐诮M內(nèi)做分享涣达,就多度了幾遍瓢剿。與阿里大數(shù)據(jù)實(shí)踐之路配合,基本可以看到阿里建設(shè)數(shù)據(jù)中臺(tái)的過程妙啃,和一些技術(shù)細(xì)節(jié)。做一件有價(jià)值的事情就是把自己覺得好的東西分享出來俊戳,那么開始內(nèi)容
(1)大數(shù)據(jù)的發(fā)展歷程和價(jià)值探索
大數(shù)據(jù)的發(fā)展
文章開篇是一段作者建設(shè)數(shù)據(jù)中臺(tái)過程的心路歷程揖赴,下來就是老套路,介紹了國內(nèi)外大數(shù)據(jù)發(fā)展的歷程與大數(shù)據(jù)的價(jià)值探索品抽,這里做簡單的介紹储笑。
兩個(gè)重要的節(jié)點(diǎn)需要說一下:
- 2003年谷歌公開了內(nèi)部對(duì)于海量文件的處理技術(shù)、GFS分布式文件系統(tǒng)圆恤、并行計(jì)算處理框架MapReduce突倍、高效數(shù)據(jù)存儲(chǔ)模型BigTable,這些促成了分布式系統(tǒng)基礎(chǔ)架構(gòu)---hadoop盆昙。為各個(gè)大數(shù)據(jù)組件的誕生打下基礎(chǔ)羽历。
- 2012年全球大數(shù)據(jù)從TB上升到PB,也是阿里大數(shù)據(jù)之路開端的一年淡喜。
大數(shù)據(jù)的價(jià)值
大數(shù)據(jù)的價(jià)值書中主要從四個(gè)方面介紹秕磷,在下面的四個(gè)方面都深刻的解析了大數(shù)據(jù)的實(shí)際應(yīng)用和真是含義。
- 語義層面:‘?dāng)?shù)據(jù)’即所有信息的記錄炼团,例如用戶訪問網(wǎng)站的信息的轉(zhuǎn)化過程的行為屬性澎嚣;大是巨量的意思,可以隱身為數(shù)量瘟芝、形式易桃、含義的豐富,保障實(shí)現(xiàn)被高保真的記錄與回放
- 實(shí)現(xiàn)層面:大數(shù)據(jù)是一套數(shù)據(jù)處理技術(shù)活方法體系,實(shí)現(xiàn)具體以上特征的數(shù)據(jù)的存儲(chǔ)锌俱、計(jì)算晤郑、共享、備份和容災(zāi)贸宏、保密等造寝,保證數(shù)據(jù)處理的時(shí)效性和拓展性
- 服務(wù)層面:大數(shù)據(jù)的數(shù)據(jù)技術(shù)變革引發(fā)的新型信息服務(wù)模式,例如從數(shù)據(jù)探索出發(fā)吭练,系統(tǒng)主動(dòng)推送信息給用戶做決策诫龙、給及其優(yōu)化參數(shù)、基于數(shù)據(jù)的量變完成數(shù)據(jù)的質(zhì)變
- 應(yīng)用層面:大數(shù)據(jù)是數(shù)據(jù)服務(wù)組合生成的新場(chǎng)景鲫咽、新體驗(yàn)赐稽、日益增長的數(shù)據(jù)量非但不會(huì)使信息獲取效率降低叫榕、質(zhì)量下降,反而會(huì)讓每個(gè)人都能得到快速的迭代姊舵,個(gè)性化的互聯(lián)網(wǎng)服務(wù)晰绎。
(2)阿里的大數(shù)據(jù)主張
在數(shù)據(jù)提供服務(wù)的基礎(chǔ)上,阿里對(duì)數(shù)據(jù)的要求是準(zhǔn)括丁、快荞下、全、統(tǒng)史飞、通尖昏,簡單的解釋是標(biāo)準(zhǔn)統(tǒng)一
融會(huì)貫通、資產(chǎn)化抽诉、服務(wù)化迹淌、閉環(huán)自優(yōu)己单,這是阿里數(shù)據(jù)中臺(tái)實(shí)現(xiàn)目標(biāo)的核心唉窃。
要實(shí)現(xiàn)上面的目標(biāo),如何做呢纹笼?
圖片展示了數(shù)據(jù)中臺(tái)運(yùn)行的過程纹份,主要抽象成三個(gè)部分
第一部分:OneData致力于實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)與統(tǒng)一
第二部分:OneEntity致力于實(shí)現(xiàn)實(shí)體的統(tǒng)一,讓數(shù)據(jù)融通而非以孤島存在廷痘,為精準(zhǔn)的用戶畫像提供基礎(chǔ)
第三部分:OneService致力于實(shí)現(xiàn)數(shù)據(jù)服務(wù)統(tǒng)一蔓涧,讓數(shù)據(jù)復(fù)用而非復(fù)制
從兩一個(gè)維度看一下數(shù)據(jù)中臺(tái)賦能業(yè)務(wù)的全景圖
- 數(shù)據(jù)后臺(tái):計(jì)算數(shù)據(jù)后臺(tái)同時(shí)具有離線計(jì)算、實(shí)時(shí)計(jì)算計(jì)算能力和在線分析能力從而可以讓用戶今早的看見昨天及以前匯總及萃取的數(shù)據(jù)笋额,準(zhǔn)確無誤的看到上一秒產(chǎn)生的數(shù)據(jù)蠢笋、在線分析,查看海量的數(shù)據(jù)
- 數(shù)據(jù)中臺(tái):云上數(shù)據(jù)中臺(tái)鳞陨、通過智能數(shù)據(jù)能力實(shí)現(xiàn)全局?jǐn)?shù)據(jù)倉庫規(guī)劃、數(shù)據(jù)規(guī)范定義瞻惋、數(shù)據(jù)建模研發(fā)歼狼、數(shù)據(jù)連接萃取掏导、數(shù)據(jù)運(yùn)維監(jiān)控,擁有多樣的數(shù)據(jù)的分層數(shù)據(jù)中心羽峰。
- 數(shù)據(jù)前臺(tái):數(shù)據(jù)前臺(tái)的核心是通過數(shù)據(jù)的復(fù)用趟咆,為多個(gè)業(yè)務(wù)線提供數(shù)據(jù)高效的數(shù)據(jù)服務(wù)添瓷。
——————————————————————————————————————
今天就介紹到這里,下次介紹阿里巴巴的大數(shù)據(jù)建設(shè)過程值纱,主要以時(shí)間為主線介紹鳞贷。
附下篇文章地址,感興趣可以繼續(xù)查看
http://www.reibang.com/p/fe573eacb822