Click house 初體驗(yàn)

簡(jiǎn)介

戰(zhàn)斗民族開(kāi)發(fā)的 olap 數(shù)據(jù)庫(kù)月帝,適用于渠道漏斗分析阱扬、app 點(diǎn)擊行為路徑分析等業(yè)務(wù)場(chǎng)景

關(guān)鍵特性

優(yōu)點(diǎn)

# 描述 備注
多引擎支持 支持多引擎 engine,生產(chǎn)環(huán)境主要是 merge tree躺彬,有點(diǎn)類(lèi)似 LSM 但是不寫(xiě)內(nèi)存煤墙,直接寫(xiě)磁盤(pán),每次攝入數(shù)據(jù)都會(huì)生成一個(gè)目錄宪拥,并會(huì)生成相關(guān)的 idx仿野、mrk、bin 文件她君,所以適合批量攝入脚作,實(shí)時(shí)攝入最好能夠進(jìn)行時(shí)間與 batch 批量攝入,server 端會(huì)異步進(jìn)行數(shù)據(jù) merge缔刹,單條攝入一定要杜絕球涛,將會(huì)對(duì)服務(wù)端造成極大壓力
向量化(SIMD) 向量化計(jì)算充分利用 cpu 資源
code gen code gen 生成優(yōu)化后的物理執(zhí)行計(jì)劃
列式存儲(chǔ) 每個(gè)列都有單獨(dú)的 mrk、bin 文件存儲(chǔ)校镐,對(duì)于壓縮友好
TTL 支持字段級(jí)和表級(jí)別的 TTL
MVCC 查詢(xún)時(shí)支持多版本亿扁,不會(huì)進(jìn)行加鎖
SQL 支持良好,分析函數(shù)豐富 提供了很多方便漏斗分析鸟廓,路徑分析的函數(shù)方便進(jìn)行 olap 分析从祝,如:sequenceMatch,groupArray等,還支持高階函數(shù),如 arrayFilter 引谜,arrayFirstIndex 等

缺點(diǎn)

# 描述 備注
不支持事務(wù) OLAP 引擎牍陌,無(wú)可厚非
僅支持 batch 攝入 由于 merge tree 本身的設(shè)計(jì)(類(lèi)似 lsm,但是無(wú) log 和 memory store员咽,不寫(xiě)內(nèi)存毒涧,直接寫(xiě)入磁盤(pán)),僅對(duì) batch 寫(xiě)入支持友好骏融,單條頻繁攝入將對(duì) server 端性能造成極大影響链嘀,server 端會(huì)頻繁 merge 造成 load 升高 實(shí)時(shí)數(shù)據(jù)攝入時(shí)需要注意
不支持二級(jí)索引
寫(xiě)放大 merge tree 會(huì)定期進(jìn)行 merge萌狂,導(dǎo)致寫(xiě)入放大,當(dāng)前類(lèi) lsm 結(jié)構(gòu)的通病
主鍵可重復(fù) 比較詭異的地方怀泊,不一定算劣勢(shì)茫藏,部分場(chǎng)景需要考慮業(yè)務(wù)層面做去重
稀疏索引不適合點(diǎn)查 稀疏索引導(dǎo)致其不適合點(diǎn)查,kv 查詢(xún)更適合使用 hbase redis 等

JDBC 客戶(hù)端

github鏈接 描述
clickhouse-jdbc 官方提供霹琼,基于 http 實(shí)現(xiàn)务傲,與 server 的 8123 端口進(jìn)行通信
ClickHouse-Native-JDBC 第三方lib,基于 tcp 實(shí)現(xiàn)枣申,與 server 的 9000 端口進(jìn)行通訊 性能相對(duì)更優(yōu)售葡,推薦使用

對(duì)比

OLAP數(shù)據(jù)庫(kù) 數(shù)據(jù)攝入 存儲(chǔ)方式 查詢(xún)性能 用戶(hù)友好程度 場(chǎng)景
Druid 支持離線(xiàn) Hdfs 數(shù)據(jù)攝入和實(shí)時(shí) Kafka 數(shù)據(jù)攝入 LSM 變種,采用一層全維度的 roll up 進(jìn)行預(yù)計(jì)算忠藤,不存儲(chǔ)明細(xì) 查詢(xún)時(shí)在 broker 層面進(jìn)行更加深層的聚合計(jì)算挟伙,毫秒級(jí)到秒級(jí) 組件繁多,包含 coordinator模孩、 overlord尖阔、broker、historical榨咐、middle manager 等多種組件和進(jìn)程介却,依賴(lài) ZK 和 mysql,運(yùn)維相對(duì)復(fù)雜块茁,維度度量修改支持在線(xiàn)修改齿坷,對(duì)用戶(hù)友好,需要時(shí)間字段 iot数焊、實(shí)時(shí)監(jiān)控指標(biāo)產(chǎn)出永淌、實(shí)時(shí)渠道聚合分析等
Kylin 支持 Hive 和 Kafka 攝入,由于使用基于 mr 和 spark 的計(jì)算引擎進(jìn)行 cube 構(gòu)建昌跌,難以達(dá)到分鐘級(jí)延遲仰禀,延遲至少在十分鐘至半小時(shí)級(jí)別 全維度預(yù)計(jì)算構(gòu)建 cube,支持一些策略的剪枝蚕愤,減少無(wú)用計(jì)算量答恶,開(kāi)源版本依賴(lài) HBase 作為 Storage 基于全量預(yù)計(jì)算產(chǎn)出、亞秒級(jí) 依賴(lài) Hadoop 生態(tài)萍诱,適合維度悬嗓、度量相對(duì)穩(wěn)定的 cube 分析,一旦需要修改維度裕坊、度量需要重新配置包竹,重新構(gòu)建,不一定需要時(shí)間字段 維度、度量明確的場(chǎng)景周瞎、偏離線(xiàn) T+1 或 H+1苗缩、分析聚合維度多樣化,維度盡量不要超過(guò) 20 維声诸,否則將產(chǎn)生維度爆炸
ClickHouse 支持離線(xiàn)在線(xiàn)數(shù)據(jù)錄入酱讶,但是由于存儲(chǔ)設(shè)計(jì)實(shí)時(shí)數(shù)據(jù)攝入千萬(wàn)不能單條頻繁攝入,一定要做 batch 匯總彼乌,秒級(jí)攝入 qps 不要超過(guò) 1 與 kylin泻肯、druid 不同,不做預(yù)計(jì)算慰照,完全是通過(guò)索引灶挟、列式存儲(chǔ)、壓縮毒租、向量化稚铣、code gen 等充分壓榨 cpu 等計(jì)算資源達(dá)到快速計(jì)算的目的 毫秒級(jí)至秒級(jí)不等 單一組件、sql 支持良好蝌衔、分析函數(shù)豐富榛泛,易上手,需要時(shí)間字段 渠道漏斗分析噩斟、app 點(diǎn)擊路徑事件分析

參考文檔

怎么用ClickHouse做漏斗分析?

轉(zhuǎn)化漏斗的基本實(shí)現(xiàn)

ClickHouse主鍵探討[譯文+補(bǔ)充]

使用ClickHouse一鍵接管MySQL數(shù)據(jù)分析

How to realize funnel analysis by ClickHouse (with our illustrating example) ?

https://clickhouse.yandex/docs/en/single/

ClickHouse 使用

數(shù)據(jù)庫(kù)稠密索引與稀疏索引

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末孤个,一起剝皮案震驚了整個(gè)濱河市剃允,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌齐鲤,老刑警劉巖斥废,帶你破解...
    沈念sama閱讀 216,651評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異给郊,居然都是意外死亡牡肉,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)淆九,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)统锤,“玉大人,你說(shuō)我怎么就攤上這事炭庙∷橇” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,931評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵焕蹄,是天一觀(guān)的道長(zhǎng)逾雄。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么鸦泳? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,218評(píng)論 1 292
  • 正文 為了忘掉前任银锻,我火速辦了婚禮,結(jié)果婚禮上做鹰,老公的妹妹穿的比我還像新娘击纬。我一直安慰自己,他們只是感情好誊垢,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,234評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布掉弛。 她就那樣靜靜地躺著,像睡著了一般喂走。 火紅的嫁衣襯著肌膚如雪殃饿。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,198評(píng)論 1 299
  • 那天芋肠,我揣著相機(jī)與錄音乎芳,去河邊找鬼。 笑死帖池,一個(gè)胖子當(dāng)著我的面吹牛奈惑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播睡汹,決...
    沈念sama閱讀 40,084評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼肴甸,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了囚巴?” 一聲冷哼從身側(cè)響起原在,我...
    開(kāi)封第一講書(shū)人閱讀 38,926評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎彤叉,沒(méi)想到半個(gè)月后庶柿,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,341評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡秽浇,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,563評(píng)論 2 333
  • 正文 我和宋清朗相戀三年浮庐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片柬焕。...
    茶點(diǎn)故事閱讀 39,731評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡审残,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出击喂,到底是詐尸還是另有隱情维苔,我是刑警寧澤,帶...
    沈念sama閱讀 35,430評(píng)論 5 343
  • 正文 年R本政府宣布懂昂,位于F島的核電站介时,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜沸柔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,036評(píng)論 3 326
  • 文/蒙蒙 一循衰、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧褐澎,春花似錦会钝、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,676評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至俭正,卻和暖如春奸鬓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背掸读。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,829評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工串远, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人儿惫。 一個(gè)月前我還...
    沈念sama閱讀 47,743評(píng)論 2 368
  • 正文 我出身青樓澡罚,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親肾请。 傳聞我的和親對(duì)象是個(gè)殘疾皇子留搔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,629評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容