最近了解了一些其他公司的數(shù)據(jù)架構(gòu)體系门烂,感覺(jué)大體上都差不多呀忧,根據(jù)公司的具體場(chǎng)景也繪制了一個(gè)比較通用的數(shù)據(jù)平臺(tái)架構(gòu),算是mark下吧琐簇。
開(kāi)始之前 Kafka源碼環(huán)境依賴Gradle、Scala和Zookeeper,所以需要提前將這些依賴安裝好,由于這三個(gè)依賴的安裝相對(duì)比較簡(jiǎn)單沃于,所...
詞云 做過(guò)數(shù)據(jù)分析的應(yīng)該對(duì)詞云這個(gè)概念不會(huì)陌生,詞云以云圖的方式將詞(一般指tag)的頻率信息很好的呈現(xiàn)出來(lái)海诲。下面是來(lái)自百度百科的定義繁莹。 “詞云...
接觸Java有段時(shí)間了,基本的原理和使用大概清楚了特幔,想通過(guò)閱讀源碼來(lái)進(jìn)一步提升Java能力咨演,聽(tīng)說(shuō)Doug Lea的java.util.concu...
前言 上一篇我們通過(guò)一個(gè)簡(jiǎn)單的例子了解了基于XML配置文件的方式初始化Mybatis的過(guò)程,毫不夸張的說(shuō)蚯斯,MyBatis初始化的過(guò)程薄风,就是創(chuàng)建 ...
前言 最近項(xiàng)目中使用到了Mybatis持久層框架,由于從來(lái)沒(méi)有深入的了解過(guò)基于Java語(yǔ)言實(shí)現(xiàn)的持久層框架拍嵌,于是有點(diǎn)心血來(lái)潮遭赂,所以就有了這篇長(zhǎng)文...
之前介紹過(guò)Apache Spark的基本概念以及環(huán)境準(zhǔn)備,本篇以分類算法為入口撰茎,主要熟悉下Spark的Python API嵌牺,重點(diǎn)不在算法,而是A...
Apache Spark 簡(jiǎn)介 Apache Spark 是什么 Apache Spark是一個(gè)分布式計(jì)算框架逆粹,旨在簡(jiǎn)化運(yùn)行于計(jì)算機(jī)集群上的并行...
每一個(gè)使用Git進(jìn)行管理的項(xiàng)目募疮,在其根目錄下都會(huì)存在一個(gè)名為 .git 的目錄,其內(nèi)容如下圖僻弹,接下來(lái)主要介紹下目錄中的HEAD阿浓、index、ob...