數(shù)據(jù)模型就是數(shù)據(jù)組織和存儲(chǔ)方法介牙,它強(qiáng)調(diào)從業(yè)務(wù)、數(shù)據(jù)存取和使用角度合理存儲(chǔ)數(shù)據(jù)澳厢。
有了適合業(yè)務(wù)和基礎(chǔ)數(shù)據(jù)存儲(chǔ)環(huán)境的模型环础,那么大數(shù)據(jù)就能獲得以下好處:
- 性能:良好的數(shù)據(jù)模型你幫助我們快速查詢所需要的數(shù)據(jù),減少數(shù)據(jù)的IO吞吐剩拢。
- 成本:良好的數(shù)據(jù)模型能極大地減少不必要的數(shù)據(jù)冗余线得,也能實(shí)現(xiàn)計(jì)算結(jié)果復(fù)用,極大地降低大數(shù)據(jù)系統(tǒng)中的存儲(chǔ)和計(jì)算成本徐伐。
- 效率:良好的數(shù)據(jù)模型能極大地改善用戶使用數(shù)據(jù)的體驗(yàn)贯钩,提高使用數(shù)據(jù)的效率。
- 質(zhì)量:良好的數(shù)據(jù)模型能改善數(shù)據(jù)統(tǒng)計(jì)口徑的不一致性办素,減少計(jì)算錯(cuò)誤的可能下角雷。
從OLTP和OLAP系統(tǒng)的區(qū)別看模型方法論的選擇:
- OLTP系統(tǒng)通常面向的主要數(shù)據(jù)操作是隨機(jī)讀寫,主要采用滿足3NF的實(shí)體關(guān)系模型存儲(chǔ)數(shù)據(jù)性穿,從而在事務(wù)處理中解決數(shù)據(jù)的冗余和一致性問題谓罗。
- OLAP系統(tǒng)面向的主要數(shù)據(jù)操作是批量讀寫,事務(wù)處理中的一致性不是OLAP所關(guān)注的季二,其主要關(guān)注數(shù)據(jù)的整合檩咱,以及在一次性的復(fù)雜大數(shù)據(jù)查詢和處理中的性能,因此它需要采用一些不同的數(shù)據(jù)建模方法胯舷。
以上文字均摘抄自:<<大數(shù)據(jù)之路-阿里巴巴大數(shù)據(jù)實(shí)踐>>,原書購(gòu)買鏈接:https://www.amazon.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE%E4%B9%8B%E8%B7%AF-%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AE%9E%E8%B7%B5-%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E6%95%B0%E6%8D%AE%E6%8A%80%E6%9C%AF%E5%8F%8A%E4%BA%A7%E5%93%81%E9%83%A8/dp/B071GW3JHM/ref=sr_1_1?ie=UTF8&qid=1503497929&sr=8-1&keywords=%E5%A4%A7%E6%95%B0%E6%8D%AE%E4%B9%8B%E8%B7%AF+%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AE%9E%E8%B7%B5