跟我學(xué)Elasticsearch(16) _bulk api的奇特json格式與底層性能關(guān)系

[Toc]

1、bulk的執(zhí)行過(guò)程

一次bulk請(qǐng)求可能包含了多個(gè)增刪改document的操作内狸,因此bulk的每個(gè)操作都可能要轉(zhuǎn)發(fā)到不同的es node的primary shard去執(zhí)行飒硅,這個(gè)過(guò)程就包含了json數(shù)據(jù)的傳輸束析。

2堡距、假如采用比較良好的json數(shù)組格式

假如使用比較良好的json數(shù)組格式趾断,會(huì)是這個(gè)樣子

POST /_bulk
{ "update": { "_index": "test_index", "_type": "test_type", "_id": "1", "_retry_on_conflict" : 3} }
{
    "doc": {
        "test_field": "update test"
    }
}

這樣看起來(lái)是不是清晰明了绍申?但es是不支持的噩咪。因?yàn)榧偃鏴s支持的話,es需要對(duì)json數(shù)組進(jìn)行額外處理极阅,整個(gè)_bulk流程是下面這樣的

(1) 將良好的json數(shù)組格式解析為JSONArray對(duì)象胃碾,這個(gè)時(shí)候,整個(gè)json就會(huì)在內(nèi)存中出現(xiàn)一份一模一樣的拷貝筋搏,一份是json文本仆百,一份是JSONArray對(duì)象

(2) 解析出json數(shù)組里的每個(gè)json(也就是document)

(3) 對(duì)每個(gè)請(qǐng)求的document進(jìn)行路由

(4) 為路由到同一個(gè)shard上的多個(gè)請(qǐng)求,創(chuàng)建一個(gè)請(qǐng)求數(shù)組

(5) 將這個(gè)請(qǐng)求數(shù)組序列化

(6) 將序列化后的請(qǐng)求數(shù)組發(fā)送到對(duì)應(yīng)的節(jié)點(diǎn)上去

之前提到過(guò)bulk size最佳大小的問(wèn)題奔脐,一般建議在幾千條或者10MB左右俄周。所以說(shuō)可怕的事情來(lái)了,假如有100個(gè)bulk請(qǐng)求發(fā)送到一個(gè)節(jié)點(diǎn)上去髓迎,然后每個(gè)請(qǐng)求是10MB峦朗,100個(gè)請(qǐng)求就是1000M=1G,然后每個(gè)請(qǐng)求的json都copy一份為JSONArray對(duì)象竖般,此時(shí)內(nèi)存占用就會(huì)翻倍甚垦,共占用2G內(nèi)存,甚至不止,因?yàn)榕蒍SONArray之后艰亮,還可能會(huì)搞一些其它的數(shù)據(jù)結(jié)構(gòu)闭翩,就會(huì)占用2G+的內(nèi)存。

占用更多的內(nèi)存可能就會(huì)積壓內(nèi)存迄埃,影響其它請(qǐng)求的內(nèi)存使用量疗韵,比如說(shuō)最重要的搜索請(qǐng)求、搜索請(qǐng)求等等侄非,此時(shí)就可能導(dǎo)致其它請(qǐng)求的性能急速下降蕉汪。

另外,占用內(nèi)存更多逞怨,也會(huì)導(dǎo)致java虛擬機(jī)的垃圾回收次數(shù)更頻繁者疤,每次要回收的垃圾對(duì)象更多,耗費(fèi)時(shí)間更多叠赦,導(dǎo)致es的java虛擬機(jī)阻塞工作線程的時(shí)間更多

3驹马、es支持的json格式

bulk的格式要求為一條數(shù)據(jù)的json要放在一行

POST /_bulk
{ "update": { "_index": "test_index", "_type": "test_type", "_id": "1", "_retry_on_conflict" : 3} }
{ "doc" : {"test_field" : "update test"} }

這樣做有什么好處呢?我們來(lái)看下整個(gè)_bulk流程

(1) 不用將其轉(zhuǎn)換為json對(duì)象除秀,不會(huì)出現(xiàn)內(nèi)存中相同數(shù)據(jù)的拷貝糯累,直接按照換行符切割json

(2) 對(duì)每?jī)蓚€(gè)一組的json,讀取meta册踩,進(jìn)行document路由

(3) 直接將對(duì)應(yīng)的json發(fā)送到node上去

其最大優(yōu)勢(shì)在于泳姐,不需要講json數(shù)組解析為一個(gè)JSONArray對(duì)象,形成一份大數(shù)據(jù)的拷貝暂吉,浪費(fèi)內(nèi)存空間胖秒,盡可能地保證性能

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市借笙,隨后出現(xiàn)的幾起案子扒怖,更是在濱河造成了極大的恐慌,老刑警劉巖业稼,帶你破解...
    沈念sama閱讀 222,807評(píng)論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盗痒,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡低散,警方通過(guò)查閱死者的電腦和手機(jī)俯邓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,284評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)熔号,“玉大人稽鞭,你說(shuō)我怎么就攤上這事∫鳎” “怎么了朦蕴?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,589評(píng)論 0 363
  • 文/不壞的土叔 我叫張陵篮条,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我吩抓,道長(zhǎng)涉茧,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,188評(píng)論 1 300
  • 正文 為了忘掉前任疹娶,我火速辦了婚禮伴栓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘雨饺。我一直安慰自己钳垮,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,185評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布额港。 她就那樣靜靜地躺著饺窿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪移斩。 梳的紋絲不亂的頭發(fā)上短荐,一...
    開(kāi)封第一講書(shū)人閱讀 52,785評(píng)論 1 314
  • 那天,我揣著相機(jī)與錄音叹哭,去河邊找鬼。 笑死痕貌,一個(gè)胖子當(dāng)著我的面吹牛风罩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播舵稠,決...
    沈念sama閱讀 41,220評(píng)論 3 423
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼超升,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了哺徊?” 一聲冷哼從身側(cè)響起室琢,我...
    開(kāi)封第一講書(shū)人閱讀 40,167評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎落追,沒(méi)想到半個(gè)月后盈滴,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,698評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡轿钠,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,767評(píng)論 3 343
  • 正文 我和宋清朗相戀三年巢钓,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疗垛。...
    茶點(diǎn)故事閱讀 40,912評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡症汹,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出贷腕,到底是詐尸還是另有隱情背镇,我是刑警寧澤咬展,帶...
    沈念sama閱讀 36,572評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站瞒斩,受9級(jí)特大地震影響破婆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜济瓢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,254評(píng)論 3 336
  • 文/蒙蒙 一荠割、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧旺矾,春花似錦蔑鹦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,746評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至柬帕,卻和暖如春哟忍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背陷寝。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,859評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工锅很, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人凤跑。 一個(gè)月前我還...
    沈念sama閱讀 49,359評(píng)論 3 379
  • 正文 我出身青樓爆安,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親仔引。 傳聞我的和親對(duì)象是個(gè)殘疾皇子扔仓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,922評(píng)論 2 361