OneData是阿里巴巴內(nèi)部進行數(shù)據(jù)整合及管理的方法體系和工具。
阿里巴巴的大數(shù)據(jù)工程師在這一體系下夫椭,構建統(tǒng)一恩急、規(guī)范、可共享的全域數(shù)據(jù)提醒纪蜒,避免數(shù)據(jù)的冗余和重復建設衷恭,規(guī)避數(shù)據(jù)煙囪和不一致性,充分發(fā)揮阿里巴巴在大數(shù)據(jù)海量纯续、多樣性方面的獨特優(yōu)勢随珠。
概述
阿里巴巴集團大數(shù)據(jù)建設方法論的核心是:從業(yè)務架構設計到模型設計,從數(shù)據(jù)研發(fā)到數(shù)據(jù)服務猬错,做到數(shù)據(jù)可管理窗看、可追溯、可規(guī)避重復建設倦炒。
定位及價值
建設統(tǒng)一的显沈、規(guī)范化的數(shù)據(jù)接入層(ODS)和數(shù)據(jù)中間層(DWD和DWS),通過數(shù)據(jù)服務和數(shù)據(jù)產(chǎn)品逢唤,完成服務于阿里巴巴的大數(shù)據(jù)系統(tǒng)建設拉讯,即數(shù)據(jù)公共層建設。提供標準化的(Standard)鳖藕、共享的(Shared)魔慷、數(shù)據(jù)服務(Service)能力,降低數(shù)據(jù)互通成本著恩,釋放計算院尔、存儲、人力等資源喉誊,以消愁業(yè)務和技術之痛邀摆。
體系架構圖