c04317906e8f - 簡書

發(fā)簡信

c04317906e8f

4
關(guān)注
5
粉絲
0
文章
0

字?jǐn)?shù)
0

收獲喜歡
1

總資產(chǎn)

IP屬地：重慶

c04317906e8f

DeepRec
寫了 8517 字苹支，被 6 人關(guān)注，獲得了 12 個喜歡

微信公眾號：深度學(xué)習(xí)與推薦系統(tǒng)
c04317906e8f

王喆的機(jī)器學(xué)習(xí)筆記
寫了 48380 字，被 374 人關(guān)注，獲得了 119 個喜歡

c04317906e8f

阿里云云棲號
寫了 0 字，被 643343 人關(guān)注，獲得了 74527 個喜歡

阿里云官網(wǎng)內(nèi)容平臺！匯聚阿里云優(yōu)質(zhì)內(nèi)容（入門榔昔、文檔驹闰、案例、最佳實踐撒会、直播等）嘹朗！如需轉(zhuǎn)載或內(nèi)容類合作，郵件yqgroup@service.aliyun.com 秒級回復(fù)诵肛！<br>
c04317906e8f

程序員
小彤花園編屹培，97071 篇文章，1662037 人關(guān)注

如果你是程序員怔檩，或者有一顆喜歡寫程序的心褪秀，喜歡分享技術(shù)干貨、項目經(jīng)驗薛训、程序員日常囧事等等媒吗，歡迎投稿《程序員》專題。專題主編：小彤花園 http://www.reibang.com/users/4a4eb4feee62/ 【程序員】專題拒稿指北：http://www.reibang.com/p/7c8b33b5f63b 投稿須知： 1.收錄相關(guān)技術(shù)文章乙埃，但不限于技術(shù)闸英，也可以是項目經(jīng)驗類的文章和程序員日常。 2.文章內(nèi)不得有任何推廣信息介袜。包括但不限于公眾號甫何、微博、微信遇伞，更不得在通過投稿后再修改文章加入推廣信息辙喂。你可以將這些推廣以及個人信息放在個人主頁介紹里。 3.字?jǐn)?shù)極少赃额，段落混亂加派，大段代碼沒有放到代碼框的文章不收錄 4.不相關(guān)的內(nèi)容不收錄，請確認(rèn)文章內(nèi)容和本專題相關(guān) 目前針對優(yōu)質(zhì)作者及愛好者跳芳，開設(shè)了官方程序員微信群，希望加入請發(fā)簡信給主編小彤花園索取個人微信竹勉，主編會將你加入到【程序員】微信群飞盆，分享內(nèi)容，收獲知識次乓。添加微信時備注昵稱吓歇。
c04317906e8f

OSC開源社區(qū)
寫了 424497 字，被 123807 人關(guān)注票腰，獲得了 6660 個喜歡

開源中國社區(qū)官方賬號城看，每天為開發(fā)者推送最新最熱的技術(shù)資訊。
c04317906e8f

另外關(guān)于第三點 “增大 threadpool.index.queue_size” 應(yīng)該也是沒有用的
索引時的并發(fā)量是跟shard的數(shù)量對應(yīng)的杏慰，但是不會超過本機(jī)的cpu 核的個數(shù)测柠。
因為es里面不管是BULK, 還是INDEX的threadPool炼鞠，線程數(shù)都是fix的，即availableProcessors（貌似可以通過配置手動修改轰胁，沒設(shè)默認(rèn)就是機(jī)器的cpu核數(shù)谒主，且不超過32）
而這個threadpool.index.queue_size，只不過是線程池等待任務(wù)隊列的大小赃阀。默認(rèn)50霎肯，若索引時es消化不過來，這個等待任務(wù)超過了隊列大小榛斯，es會直接拒絕請求观游，拋出EsRejectException。

如何提高ElasticSearch 索引速度
我Google了下驮俗，大致給出的答案如下：使用bulk API 初次索引的時候备典，把 replica 設(shè)置為 0 增大 threadpool.index.queue_size ...

祝威廉
33506 15 40 1
c04317906e8f

ElasticSearch 深入
祝威廉編，36 篇文章意述，841 人關(guān)注

Es 源碼解析類的文章

c04317906e8f

關(guān)于version這塊提佣，一般是不會影響索引速度的吧。
一般情況下索引數(shù)據(jù)時你是不會自己提供id的荤崇，這時es會為每條數(shù)據(jù)自動生成一個base64 UUID拌屏，而且好像還是字典序上的自增，這個時候記錄索引默認(rèn)是create术荤，這根本就不存在版本沖突和加鎖的問題吧倚喂。
如果你是指索引的meta state的版本號。這個版本號一般只會在發(fā)生了field mapping的更新瓣戚，setting的更新時版本號才會更新端圈。當(dāng)你海量數(shù)據(jù)導(dǎo)入的時候，數(shù)據(jù)的列總不會每條數(shù)據(jù)都不一樣吧子库？所以這個版本號也是不會頻繁更新的舱权。
不知道我有沒有理解正確你的意思？

如何提高ElasticSearch 索引速度
我Google了下仑嗅，大致給出的答案如下：使用bulk API 初次索引的時候宴倍，把 replica 設(shè)置為 0 增大 threadpool.index.queue_size ...

祝威廉
33506 15 40 1
c04317906e8f