sphinx的特色之一是建立索引速度快,最近轉(zhuǎn)投Elasticsearch后,一直想做個(gè)對(duì)比,網(wǎng)上資料常見說法是10倍的差距。
測(cè)試環(huán)境
- 硬件:?jiǎn)魏耍?G內(nèi)存的E5-2630 虛擬機(jī)
- 操作系統(tǒng):Centos 6.5
版本
- sphinx 版本:coreseek 4.1(基于sphinx 2.02)
- Elasticsearch 版本:2.3.1
- mysql 版本:5.6
分詞器(均使用默認(rèn)的分詞詞庫)
- mmseg:coreseek自帶
- ik:Elasticsearch 插件
索引數(shù)據(jù)源
- 數(shù)據(jù)庫:mysql
- 數(shù)據(jù)量:46萬+篇文章义起,約為1.6G數(shù)據(jù)
- 建立索引的字段:id,title师崎,content
- Elasticsearch 使用插件:Elasticsearch-jdbc 2.3.1
Elasticsearch 集群設(shè)置
為了盡可能接近單機(jī)測(cè)試默终,Elasticsearch 僅開啟一個(gè)服務(wù)節(jié)點(diǎn)(本地),且索引不做分片犁罩,不做副本齐蔽。
測(cè)試情況
sphinx
- 每秒處理數(shù)據(jù)量:2.77 MB
-
每秒處理文檔數(shù):1277 篇
Elasticsearch
- 每秒處理數(shù)據(jù)量:0.794 MB
- 每秒處理文檔數(shù):397 篇
測(cè)試結(jié)論
- sphinx 索引速度確實(shí)相對(duì)比較快,可能是環(huán)境的差異床估,未達(dá)到官方所說的10M/s 的索引速度含滴;
- 同等環(huán)境下,Elasticsearch索引速度約為sphinx的1/4丐巫,但實(shí)際生產(chǎn)環(huán)境下谈况,Elasticsearch應(yīng)該會(huì)有較大提升(多核、高內(nèi)存硬件)递胧,而不會(huì)僅僅約400+篇/s的索引速度碑韵。