2018年上半年

2018已經(jīng)快過半,想總結(jié)一下梧躺,自己有哪些提高似谁。

先把2017年補(bǔ)充一下:2017年年底,我之前做的東西被分配給其它組去做掠哥,我只剩下維護(hù)老流程的工作巩踏,無聊之下,想了想當(dāng)前爬蟲系統(tǒng)可改進(jìn)的痛點(diǎn)(其實(shí)就是url輸入kafka续搀,爬蟲從kafka消費(fèi)塞琼,再把頁面輸出到kafka,而不是本地保存禁舷,再發(fā)往consumer彪杉,consumer這東西可以水平擴(kuò)展毅往,但是每次水平擴(kuò)展都需要找運(yùn)維同學(xué)手動(dòng)改爬蟲配置,有些惡心派近;并且攀唯,抓不同的頁面,有不同的批次概念渴丸,每個(gè)批次對(duì)應(yīng)一組consumer侯嘀,線上批次非常多了,導(dǎo)致consumer也散布的到處都是谱轨,不好統(tǒng)一管理)戒幔。

我隨后想到,kafka-->爬蟲-->kafka土童,這種比較通用的結(jié)構(gòu)估計(jì)早有人實(shí)現(xiàn)了诗茎,畢竟不是很難想到的結(jié)構(gòu)。隨后查了一下娜扇,發(fā)現(xiàn)github上果然后類似項(xiàng)目错沃。隨后開始了我走向分布式學(xué)習(xí)的路程。

在github上的項(xiàng)目雀瓢,是kafka-->redis-->爬蟲-->kafka的結(jié)構(gòu)枢析,之所以用redis,是因?yàn)閞edis有優(yōu)先隊(duì)列刃麸,并且很方便的為每個(gè)host設(shè)置一個(gè)隊(duì)列醒叁。明顯,單機(jī)的redis內(nèi)存容易成瓶頸泊业,于是我查看了redis-cluster把沼,數(shù)據(jù)分片、主從備份吁伺、第一次對(duì)分布式系統(tǒng)有了模糊的認(rèn)識(shí)饮睬。

后來老大看我周報(bào)寫的簡(jiǎn)單,詢問我情況篮奄,我告訴他我現(xiàn)在沒什么事情做捆愁,并把我對(duì)爬蟲改進(jìn)的想法一并告訴他,起初他也挺感興趣窟却,但他和我思維不一致的地方在于昼丑,他的底線是不修改線上大規(guī)模爬蟲(可能他認(rèn)為這套爬蟲已經(jīng)用了很多年,不到迫不得已必須修改的境況)夸赫,沒有做這個(gè)改進(jìn)菩帝。也讓我對(duì)我們組徹底失去信心,2018年初我出去面試了。

看過redis-cluster后呼奢,又發(fā)現(xiàn)了ssdb宜雀,一個(gè)基于leveldb的,支持redis協(xié)議的磁盤數(shù)據(jù)庫控妻,還有類似的ledisdb州袒,等等。很多kv都是在leveldb基礎(chǔ)上的改進(jìn)和封裝弓候。

2018年

2018年過完年郎哭,我去面試了一家中等規(guī)模的公司,結(jié)果慘不忍睹菇存,項(xiàng)目一句話沒問(人家不感興趣)夸研,對(duì)照著掌握的技術(shù),問了底層原理依鸥,比如結(jié)合yarn的資源管理亥至,描述spark的啟動(dòng)流程;你會(huì)如何給分布式redis做分片贱迟,結(jié)合kafka的parition主從備份姐扮,大概描述一下paxos過程等,由于我基礎(chǔ)掌握的太差了衣吠,有些問題沒有系統(tǒng)茶敏,強(qiáng)化的學(xué)習(xí),答得非常糟糕缚俏,面試后惊搏,我決定要把基礎(chǔ)好好補(bǔ)一補(bǔ)。

回來后忧换,先查了一下yarn是做什么的恬惯;又無意接觸到了一本導(dǎo)論性質(zhì)的大數(shù)據(jù)-分布式系統(tǒng)的書,網(wǎng)上評(píng)價(jià)很高亚茬,于是決定把這本書啃下來酪耳。這本書一上來就介紹基礎(chǔ)的存儲(chǔ)結(jié)構(gòu),主要有LSM和B-Tree刹缝,不得不說葡兑,LSM介紹的很淺顯易懂,從一個(gè)最簡(jiǎn)單的log追加型kv赞草,一步步優(yōu)化到LSM結(jié)構(gòu),優(yōu)化過程自然不唐突吆鹤。比網(wǎng)上那些博客一上來就貼一張LSM結(jié)構(gòu)圖厨疙,容易理解的多。B-Tree由于主要用于關(guān)系數(shù)據(jù)庫疑务,就沒有看沾凄。 (2018年下半年梗醇,抽空把B-tree也了解一下,LSM論文也要仔細(xì)看一遍撒蟀,要做到能寫一個(gè)LSM的輪子的地步叙谨,才算基本掌握)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末保屯,一起剝皮案震驚了整個(gè)濱河市手负,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌姑尺,老刑警劉巖竟终,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異切蟋,居然都是意外死亡统捶,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門柄粹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來喘鸟,“玉大人,你說我怎么就攤上這事驻右∈埠冢” “怎么了?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵旺入,是天一觀的道長(zhǎng)兑凿。 經(jīng)常有香客問我,道長(zhǎng)茵瘾,這世上最難降的妖魔是什么礼华? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蒜撮。我一直安慰自己侠仇,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布羡藐。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪棒搜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天活箕,我揣著相機(jī)與錄音力麸,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛克蚂,可吹牛的內(nèi)容都是我干的闺鲸。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼埃叭,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼摸恍!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起赤屋,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤立镶,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后益缎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體谜慌,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年莺奔,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了欣范。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡令哟,死狀恐怖恼琼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情屏富,我是刑警寧澤晴竞,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布,位于F島的核電站狠半,受9級(jí)特大地震影響噩死,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜神年,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一已维、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧已日,春花似錦垛耳、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至护奈,卻和暖如春缔莲,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背霉旗。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來泰國(guó)打工酌予, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留磺箕,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓抛虫,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親简僧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子建椰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容