ES:reindex中的坑

吐槽一個ES-reindex遷移的大坑

在做ES跨集群遷移的時候,用到了ES的reindex進(jìn)行數(shù)據(jù)遷移,查了很多資料,包括官方文檔仓坞,比如:

https://www.elastic.co/guide/en/elasticsearch/reference/5.4/docs-reindex.html#docs-reindex
https://blog.csdn.net/weixin_38920212/article/details/102461563

其中就用到了 "routing": "=cat" 這個配置項。而現(xiàn)在腰吟,我只想罵人无埃。

發(fā)生甚么事了

在ES中,一個doc在寫入ES時毛雇,會根據(jù)數(shù)據(jù)計算一個routing嫉称,根據(jù)該值計算推算出具體數(shù)據(jù)寫入到哪個分片中,具體的計算公式是:

shard = hash(routing) % number_of_primary_shards

routing是一個可變值灵疮,默認(rèn)是文檔的_id织阅,正常來說隨機生成的id得到的shard值,會使數(shù)據(jù)在各個shard間分配的非常均勻震捣。

而如果我們使用reindex進(jìn)行索引重建或數(shù)據(jù)遷移的時候荔棉,需要指定routing選項闹炉,具體的含義如下:

  • keep : 和源索引的routing值保持一致,默認(rèn)值
  • discard : 對每個routing設(shè)置為null
  • =<some text> : 設(shè)置為=之后的文本

如果使用第三個润樱,設(shè)置為官方的示例 routing=cat剩胁,那就會導(dǎo)致所有doc的路由值都是cat,然后計算出來的目標(biāo)shard相同祥国,我這里使用6個shard,全部落在了shard2上晾腔。

導(dǎo)致有一個節(jié)點的數(shù)據(jù)遠(yuǎn)超其他節(jié)點:


有一個索引是123GB大小舌稀,全落在一個Shard上了,真是無Fuck說灼擂。


為什么會犯這么蠢的錯誤

首先是沒有好好看一遍官方文檔壁查,只是看了一些國內(nèi)的博客就開干了,國內(nèi)的博客全一模一樣剔应,全都是routing=cat睡腿,我還以為這是個優(yōu)化功能。甚至有一片博客說這個值通過掃描所有內(nèi)容來生成新的routing值峻贮。

有時候真的服了一些人席怪,自己沒能力寫一些內(nèi)容嗎?全是復(fù)制的纤控?那你當(dāng)作自己的文檔可以嗎挂捻?發(fā)表出來干嘛呢?真是服了4颉刻撒!自己實踐過嗎?耿导?声怔?

怪不得大家都用Google,國內(nèi)一查全一模一樣舱呻,都不知道啥版本的醋火,誰敢用啊。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末箱吕,一起剝皮案震驚了整個濱河市胎撇,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌殖氏,老刑警劉巖晚树,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異雅采,居然都是意外死亡爵憎,警方通過查閱死者的電腦和手機慨亲,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來宝鼓,“玉大人刑棵,你說我怎么就攤上這事∮拚。” “怎么了蛉签?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長沥寥。 經(jīng)常有香客問我碍舍,道長,這世上最難降的妖魔是什么邑雅? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任片橡,我火速辦了婚禮,結(jié)果婚禮上淮野,老公的妹妹穿的比我還像新娘捧书。我一直安慰自己,他們只是感情好骤星,可當(dāng)我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布经瓷。 她就那樣靜靜地躺著,像睡著了一般洞难。 火紅的嫁衣襯著肌膚如雪了嚎。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天廊营,我揣著相機與錄音歪泳,去河邊找鬼。 笑死露筒,一個胖子當(dāng)著我的面吹牛呐伞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播慎式,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼伶氢,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了瘪吏?” 一聲冷哼從身側(cè)響起癣防,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎掌眠,沒想到半個月后蕾盯,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡蓝丙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年级遭,在試婚紗的時候發(fā)現(xiàn)自己被綠了望拖。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡挫鸽,死狀恐怖说敏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情丢郊,我是刑警寧澤盔沫,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布架诞,位于F島的核電站婿牍,受9級特大地震影響惩歉,放射性物質(zhì)發(fā)生泄漏撑蚌。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一粉楚、第九天 我趴在偏房一處隱蔽的房頂上張望模软。 院中可真熱鬧饮潦,春花似錦、人聲如沸回俐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至政冻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間汽摹,已是汗流浹背苦锨。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工舟舒, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留秃励,地道東北人。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓皆尔,卻偏偏與公主長得像慷蠕,于是被迫代替她去往敵國和親食呻。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容