![240](https://cdn2.jianshu.io/assets/default_avatar/8-a356878e44b45ab268a3b0bbaaadeeb7.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
最近了解了一些其他公司的數(shù)據(jù)架構(gòu)體系吊洼,感覺大體上都差不多菩佑,根據(jù)公司的具體場景也繪制了一個(gè)比較通用的數(shù)據(jù)平臺架構(gòu)口锭,算是mark下吧歌逢。
開始之前 Kafka源碼環(huán)境依賴Gradle旅择、Scala和Zookeeper,所以需要提前將這些依賴安裝好产园,由于這三個(gè)依賴的安裝相對比較簡單讨永,所...
詞云 做過數(shù)據(jù)分析的應(yīng)該對詞云這個(gè)概念不會陌生滔驶,詞云以云圖的方式將詞(一般指tag)的頻率信息很好的呈現(xiàn)出來。下面是來自百度百科的定義卿闹。 “詞云...
接觸Java有段時(shí)間了揭糕,基本的原理和使用大概清楚了萝快,想通過閱讀源碼來進(jìn)一步提升Java能力,聽說Doug Lea的java.util.concu...
前言 上一篇我們通過一個(gè)簡單的例子了解了基于XML配置文件的方式初始化Mybatis的過程著角,毫不夸張的說揪漩,MyBatis初始化的過程,就是創(chuàng)建 ...
前言 最近項(xiàng)目中使用到了Mybatis持久層框架吏口,由于從來沒有深入的了解過基于Java語言實(shí)現(xiàn)的持久層框架奄容,于是有點(diǎn)心血來潮,所以就有了這篇長文...
之前介紹過Apache Spark的基本概念以及環(huán)境準(zhǔn)備产徊,本篇以分類算法為入口昂勒,主要熟悉下Spark的Python API,重點(diǎn)不在算法舟铜,而是A...
Apache Spark 簡介 Apache Spark 是什么 Apache Spark是一個(gè)分布式計(jì)算框架,旨在簡化運(yùn)行于計(jì)算機(jī)集群上的并行...
每一個(gè)使用Git進(jìn)行管理的項(xiàng)目谆刨,在其根目錄下都會存在一個(gè)名為 .git 的目錄塘娶,其內(nèi)容如下圖,接下來主要介紹下目錄中的HEAD痊夭、index血柳、ob...