過去十年引起廣泛關(guān)注的數(shù)據(jù)模型是 MapReduce,但 MapReduce 不是一種具有普適性的架構(gòu)捏卓。相反丛忆,MapReduce 市場已經(jīng)轉(zhuǎn)變?yōu)?HDFS 市場,并且似乎準(zhǔn)備成為關(guān)系型 SQL 市場盖袭。
最近失暂,HDFS 領(lǐng)域出現(xiàn)了另一個值得討論的重點彼宠,即“數(shù)據(jù)湖”。HDFS 集群(目前大多數(shù)企業(yè)已經(jīng)投資并希望找到對他們有用的東西)的合理使用是作為已攝取的數(shù)據(jù)文件隊列弟塞。隨著時間的推移凭峡,企業(yè)將找出哪些值得花精力清理。因此决记,數(shù)據(jù)湖同時只是文件的“垃圾抽屜”摧冀。
It is hard to imagine that “one size fits all” will ever be the dominant architecture again. 也就是說,歷史是不會倒退的霉涨。雖然是可能向關(guān)系型數(shù)據(jù)庫轉(zhuǎn)型按价,但是一定是關(guān)系型數(shù)據(jù)庫的強(qiáng)化升級,譬如 NewSQL笙瑟。
不變的
新的基礎(chǔ)架構(gòu)仍然是 parsing/optimizer/executor structure 架構(gòu)
變的
concurrency control, crash recovery, optimization, data structures and indexing